刚试了Claude 4,200K上下文确实爽,一口气扔整份代码库进去分析都没问题。推理能力提升明显,数学证明和复杂逻辑题比之前准多了,编程debug也少绕弯路。感觉写长文时记忆连贯性更好,不会像以前聊着聊着就忘了开头。不过具体能不能全面超越GPT-4,还得等更多人实测,目前看是今年最值得期待的升级之一。