Cursor这次的新模型Composer 2.5,直接把性价比拉到了一个新高度。官方宣称以Claude Opus 4.7十分之一的成本,就能获得几乎同等级别的性能表现,这对于每天和代码打交道的开发者来说,无疑是一颗重磅炸弹。更值得注意的是,Cursor这次在模型来源上不再遮遮掩掩,而是大方承认使用了Kimi作为基础模型,并明确披露了自研投入占比——自家额外训练和强化学习消耗了85%的总算力,这在AI圈实属罕见。具体来看性能数据,Composer 2.5在多个基准测试中与Opus 4.7几乎并驾齐驱:Terminal-Bench 2.0得分69.3%对69.4%,SWE-Bench Multilingual达到79.8%对80.5%,CursorBench v3.1则是63.2%对最高配的64.8%。差距都在1.5个百分点以内。除了模型智能的提升,Cursor还在易用性上做了关键改进,比如在强化学习训练中引入了定向反馈机制——以前模型犯错只能得到模糊的最终奖励信号,现在系统会在具体步骤上直接给出纠正,这让模型在长时间、多步骤的复杂任务中表现更加稳定。价格方面,Composer 2.5的标准版每百万输入token仅0.50美元,输出token 2.50美元;速度更快的默认变体则分别为3.00美元和15.00美元。作为对比,Opus 4.7的标准定价是输入15美元、输出75美元每百万token,差距确实达到了10倍。不少开发者已经给出了积极反馈,Snapchat前机器学习工程师甚至直言,如果还在用最贵的模型处理所有任务,80%的开发预算都是浪费。一家图像生成公司的CEO也表示,Composer 2.5的完成度太高,让他几乎不再需要手动修改AI生成的方案。有趣的是,这场技术发布还带出了一段小插曲。马斯克此前在Cursor陷入套壳争议时曾公开嘲讽,如今却因为算力合作而180度转变态度,主动为Cursor站台。Composer 2.5的部分训练是在马斯克的Colossus 2超算上完成的,双方还计划从零开始训练一个规模更大的模型。对于Cursor来说,这既是自研路线的关键一步,也意味着未来可能面临更大的期望和压力。无论如何,对于开发者而言,能用更低的成本获得接近顶级的编码体验,这本身就是一件值得尝试的事情。
Cursor新模型Composer 2.5:1/10成本媲美Opus 4.7
AITNT
12天前
11
10
本文由 Zyentor(智元界) 原创发布,转载请注明出处。
欢迎在 技术论坛 讨论本文相关内容