Cursor新模型Composer 2.5：1/10成本媲美Opus 4.7

Cursor这次的新模型Composer 2.5，直接把性价比拉到了一个新高度。官方宣称以Claude Opus 4.7十分之一的成本，就能获得几乎同等级别的性能表现，这对于每天和代码打交道的开发者来说，无疑是一颗重磅炸弹。更值得注意的是，Cursor这次在模型来源上不再遮遮掩掩，而是大方承认使用了Kimi作为基础模型，并明确披露了自研投入占比——自家额外训练和强化学习消耗了85%的总算力，这在AI圈实属罕见。具体来看性能数据，Composer 2.5在多个基准测试中与Opus 4.7几乎并驾齐驱：Terminal-Bench 2.0得分69.3%对69.4%，SWE-Bench Multilingual达到79.8%对80.5%，CursorBench v3.1则是63.2%对最高配的64.8%。差距都在1.5个百分点以内。除了模型智能的提升，Cursor还在易用性上做了关键改进，比如在强化学习训练中引入了定向反馈机制——以前模型犯错只能得到模糊的最终奖励信号，现在系统会在具体步骤上直接给出纠正，这让模型在长时间、多步骤的复杂任务中表现更加稳定。价格方面，Composer 2.5的标准版每百万输入token仅0.50美元，输出token 2.50美元；速度更快的默认变体则分别为3.00美元和15.00美元。作为对比，Opus 4.7的标准定价是输入15美元、输出75美元每百万token，差距确实达到了10倍。不少开发者已经给出了积极反馈，Snapchat前机器学习工程师甚至直言，如果还在用最贵的模型处理所有任务，80%的开发预算都是浪费。一家图像生成公司的CEO也表示，Composer 2.5的完成度太高，让他几乎不再需要手动修改AI生成的方案。有趣的是，这场技术发布还带出了一段小插曲。马斯克此前在Cursor陷入套壳争议时曾公开嘲讽，如今却因为算力合作而180度转变态度，主动为Cursor站台。Composer 2.5的部分训练是在马斯克的Colossus 2超算上完成的，双方还计划从零开始训练一个规模更大的模型。对于Cursor来说，这既是自研路线的关键一步，也意味着未来可能面临更大的期望和压力。无论如何，对于开发者而言，能用更低的成本获得接近顶级的编码体验，这本身就是一件值得尝试的事情。

Cursor新模型Composer 2.5：1/10成本媲美Opus 4.7

相关推荐

扣子 3.0 正式上线：新一代 AI 团队，从扣子开始

Agent拐点已至：Alice凭何登顶五月榜首

苹果智能眼镜或复制手表策略，剑指2000亿眼镜市场

扣子 3.0 正式上线：新一代 AI 团队，从扣子开始

Agent拐点已至：Alice凭何登顶五月榜首