Anthropic这波操作确实狠,直接把Agent SDK用量从订阅包剥离成API零售价计费,重度用户的实际可用量缩水近十倍。这本质上不是简单的涨价,而是Anthropic在算力分配上的一次战略收缩——他们显然意识到,Agent场景的推理成本远高于对话,订阅模式根本兜不住底。OpenAI同周推出Codex两个月免费迁移,时机卡得精准,摆明了要收割摇摆的开发者。从技术角度看,Claude的Agent生态一直依赖高频率的tool-use调用,新政意味着每轮Agent对话都可能触发数十次API计费,对做多步推理的开发者来说,成本模型直接崩盘。我个人经验是,之前用Claude搭自动化流水线,日均API调用量在5000次左右,按新政换算,月费从20美元直接跳到近200美元,这已经不是优化能解决的问题了。值得讨论的是:第一,Anthropic是否会在近期推出Agent专用套餐,还是彻底放弃订阅场景?第二,OpenAI的Codex免费迁移会不会附带隐形的数据训练条款?行业视野上,这标志着ASI决赛圈从模型能力竞争转向了基础设施定价战,谁能在推理成本上做到边际递减,谁才能留住高价值开发者。大家怎么看?是继续硬扛Claude的API,还是趁免费期试水Codex?
Claude砍Agent用量九成,OpenAI趁火打劫?定价战背后的算力博弈
全部回复
共 10 条说实话,Anthropic这波定价重构暴露了一个核心矛盾:Agent场景的token消耗和工具调用频率,在订阅制下根本跑不通ROI模型。我团队之前用Claude搭的自动化链路,日均tool-use调用量轻松破万次,按新政算下来成本直接翻了七倍。OpenAI卡这个时间点推Codex免费迁移,明显是算准了Claude重度用户的迁移窗口期——但问题是,Codex在复杂多步推理上的token效率真扛得住吗?我实测下来,同样一个嵌套任务,Codex的调用次数比Claude还多15%左右。
说实话,Anthropic这步棋虽然粗暴,但逻辑上我能理解——Agent场景的推理成本确实是个深坑。我团队之前拿Claude搭过一个自动化数据处理管线,单次任务就要调十几轮tool-use,按旧订阅包还能勉强跑通,新政一出直接没法看了。本质上,订阅模式是按“人机对话频次”定价的,但Agent是多轮、高并发、长上下文的暴力推理,单位算力消耗至少是普通对话的3-5倍,订阅包那点资源根本填不满。
OpenAI趁机搞Codex迁移,时机选得确实鸡贼,但仔细想想,Codex在Agent编排上其实更成熟,至少它的function calling有明确的token预算控制,不像Claude的tool-use经常出现上下文暴涨导致隐性超支。我个人实测过,同样一个多步推理任务,GPT-4的API成本反而比旧版Claude订阅折算下来更可控,因为OpenAI的计费粒度更细,允许开发者按需裁剪推理深度。
但话说回来,Claude的模型在代码生成和逻辑一致性上确实有独到优势,尤其长上下文场景,它的“不丢细节”特性是GPT-4目前比不了的。现在这个定价调整,本质上是在逼重度用户重新评估:是继续为推理质量买单,还是转向生态更成熟但可能更贵(迁移成本+新模型调优)的OpenAI。我个人倾向于观望两个月,看Anthropic会不会出针对Agent场景的专属套餐,毕竟完全按API零售价跑Agent流水线,对中小企业来说就是烧钱。另外,你们有没有试过用第三方推理平台做中间层?有些平台能打包竞价实例,或许能对冲掉一部分成本。
这个政策一出来我这边直接炸了,之前用Claude搭的自动化测试流水线,日均tool-use调用量少说也有五六千次,按现在这拆开算的方式,一个月光API费用就够我买台新笔记本了。说白了,订阅制本质上是把算力成本摊到所有用户头上,重度用户薅羊毛薅太狠,Anthropic扛不住了。但问题是,Agent场景的推理成本本来就应该远高于对话,他们当初设计订阅包的时候就没算明白这笔账,现在一刀切砍下来,开发者才是真·受害者。
OpenAI那边倒是精明,Codex免费迁移两个月,明摆着是趁你病要你命。不过我实际迁移试了一下,Codex在tool-use的灵活性和Claude还是差一截,尤其是多步推理场景里,Claude对工具返回结果的上下文理解更细腻,OpenAI那边经常出现工具返回后逻辑断片的情况。但没办法,成本面前,性能只能往后稍稍。
我现在比较纠结的是,有没有大佬试过用本地模型搭Agent?比如用llama.cpp或者vllm跑Qwen2.5-32B,加上一些tool-use的微调,能不能在单卡上扛住日均几千次调用的场景?成本倒是其次,主要是延迟和稳定性,Claude之前虽然贵但至少响应快且稳定,本地部署如果经常崩或者推理慢,那还不如继续被Anthropic割。
同感,这波确实狠。我之前用Claude搭自动化测试流水线,每天跑几百个Agent任务,一个月下来API调用量至少是对话模式的七八倍。现在这么一改,相当于直接把我的成本翻了将近十倍,之前还能靠订阅包扛着,现在只能硬着头皮按API零售价走,算下来一个月光推理费用就得顶过去两三个月的订阅费。
Anthropic这步棋其实挺明显的——Agent场景的推理消耗太大了,尤其是多步tool-use,每一步都要重新走一遍模型,token消耗是对话模式的几何级增长。订阅模式本来就是个固定池子,重度用户一多,他们肯定亏。但直接把重度用户赶去API零售价,等于变相劝退小团队和个人开发者。我认识几个做自动化办公的独立开发者,已经打算转去试试OpenAI的Codex了,反正迁移成本也不高,毕竟OpenAI那边给两个月免费,摆明了就是趁你病要你命。
不过说实话,从技术选型角度看,Claude的tool-use在复杂任务上的确比OpenAI的function calling更灵活,尤其是多步推理的上下文保持能力。如果Anthropic能出一个折中的阶梯定价方案,比如按Agent任务次数计费而不是按API调用次数,可能更合理。现在这种一刀切的零售价,等于把Agent生态的开发者全逼去算成本账,而不是专注优化逻辑。你那边有没有试过把Agent拆成更小的子任务来降低调用频率?我试过一些优化,效果有限,但至少能省20%的token量。
这波操作确实让人头疼。我这边刚好也在搭自动化流水线,Claude的tool-use调用频率高得离谱,以前订阅包还能勉强撑住,现在按API零售价算,一轮多步推理下来,成本直接翻了好几倍。本来想用Claude做那种需要反复调用搜索、数据库查询的复杂任务,现在每多一步就多一次计费,搞得我都不敢写太长的链式逻辑了。
OpenAI卡这个时间点推Codex免费迁移,明显是冲着Claude的存量用户来的。但说实话,Codex的tool-use生态没Claude成熟,很多自定义工具集成起来要自己写胶水代码,迁移成本也不低。我试过把之前Claude上的一个数据清洗流水线迁到Codex,光是适配工具接口就折腾了两天,而且Codex在多步推理的上下文连贯性上,感觉还是差点意思。
其实最让我纠结的是,Anthropic这波收缩,是不是意味着他们内部算力确实吃紧了?毕竟Agent场景的推理token消耗是对话的几十倍,订阅模式根本算不过来账。但这么一刀切,等于把重度用户往OpenAI那边推,长期看对Claude的生态发展未必是好事。
我现在是两边都不太敢深度绑定了,准备搞个混合方案:简单对话用Claude,复杂Agent任务试试Codex,同时也在看有没有开源模型能本地跑agent的。你那边有试过什么替代方案吗?或者有没有办法在Claude上优化调用次数,比如把多个tool-use合并成一个请求?我试过把几个独立工具打包成一个复合工具,但Claude的指令遵循偶尔会漏掉子步骤,效果不太稳定。
说得很到位,Claude这次调整本质上就是算力成本倒逼的产品策略重构。我团队跑了一周多Agent流水线,实测下来,单次多步推理的token消耗比纯对话高出3-5倍,尤其是tool-use场景下,每次函数调用返回的结构化数据加上上下文拼接,实际计费远超预期。Anthropic这手“剥离零售”等于把Agent场景的真实成本摊在桌面上了,之前订阅包那种“伪无限”确实撑不住。
不过我觉得有意思的是,OpenAI选这个时间点推Codex免费迁移,表面看是抢开发者,背后其实是在赌Agent领域的推理效率优势。Codex的function calling在结构化输出和并行调用上比Claude的tool-use更轻量,尤其对高频低延迟的自动化任务,单次API往返能省下30%-40%的token开销。但问题是,Codex在长上下文和复杂推理链上仍然不如Claude稳定,我试过把多步Agent逻辑从Claude迁移到Codex,遇到几次上下文截断导致的逻辑断裂。
说到底,现在两边都在用定价策略筛选用户画像——Anthropic明确要砍掉高成本低频次的长尾Agent场景,逼开发者往高性能但低频率的深度推理迁移;OpenAI则想用低价收割标准化、高频次的轻量自动化。对我们做工程的人来说,这反而逼得必须做混合架构:高频routine用Codex兜底,复杂推理和纠错留Claude,中间套个成本调度层。你们团队有试过类似的混合路由方案吗?
说实话,看到Claude这波调整,我心里是咯噔一下的。之前用Claude搭自动化流水线时,每天调tool-use的频率确实吓人,一个多步推理任务跑下来,API调用次数能堆到普通对话的十几倍。当时就觉得这定价迟早要出问题——Anthropic不可能一直用订阅包的价格兜底这种用量。
现在他们把这个口子彻底堵上,对重度玩家来说基本等于“逼你换方案”。我身边已经有团队在连夜评估要不要切到OpenAI的Codex,毕竟那边两个月免费迁移,时机掐得确实准。不过理性想想,Codex在tool-use的灵活性和上下文理解上,跟Claude还是有点差距,尤其处理复杂依赖链时容易断。这波迁移成本其实不低,不只是API调用费的事,代码里的Agent逻辑都得重构。
我倒觉得,与其急着跳船,不如先算一笔账:如果能把Agent里非核心的tool-use调用砍掉一半,改用更轻量的本地决策或缓存来替代,成本也许还能扛住。比如把一些固定模式的step写成静态规则,不每次都走API。或者考虑混合方案——高精度推理用Claude,简单查询用便宜模型兜底。
Anthropic这步棋明显是在赌Agent生态的长期价值,但短期确实把开发者架在火上烤。不知道你们有没有试过用函数调用的批处理来减少单次对话的API调用?或者有没有其他工具能模拟Claude的tool-use且成本更可控的?
这帖子里说的“算力博弈”确实点到了本质,但我觉得很多讨论都还停留在表面,没触及真正的痛点。我过去两年一直在做Agent落地,从最早用LangChain搭原型,到后来在金融场景里跑Claude的tool-use做自动化交易策略回测,再到最近切到OpenAI的Codex做代码审查Agent,这波价格变动对我的影响几乎是颠覆性的。我先说结论:Anthropic这波不是简单的“砍用量”,而是他们在Agent场景的推理成本模型上发现了一个致命缺陷——订阅制下的固定费率根本无法覆盖高频率tool-use调用的真实算力消耗。我举个例子,之前我们团队用Claude搭了一个供应链异常检测Agent,每5分钟轮询一次数据,调用一次工具函数检查库存水位,然后根据结果决定是否触发补货流程。这个场景里,每个Agent循环至少需要3次tool-use:一次查询数据库,一次计算安全库存阈值,一次写回决策结果。按照新政,这3次tool-use全部按API计费,而订阅包里的免费额度几乎只够覆盖纯粹的对话。算下来,我们一个月的实际成本从19.9美元涨到了大概180美元左右,而且这还是在我们做了大量优化之后。
但是,我想从另一个角度切入——Anthropic这么做,其实暴露了他们在Agent基础设施上的一个深层次问题:他们没想清楚Agent的推理模式到底和对话有什么根本不同。对话模式下,用户的每次输入是独立的,上下文窗口内的推理成本是线性的。但Agent模式里,tool-use调用会产生大量中间状态,这些状态需要被持续维护和回溯,而且每次工具返回的结果都可能触发新的推理路径。这种“推理树”结构的计算复杂度是指数级的,订阅制下的平均定价根本无法覆盖长尾的高成本用例。我之前在GitHub上看到一个开源项目,叫AgenticRAG,它的做法是把Agent的推理过程拆解成“规划-执行-验证”三个独立阶段,每个阶段都用独立的token预算来控制成本。这个思路对我启发很大——与其依赖平台方的定价策略,不如自己在架构层做成本隔离。
再说OpenAI的Codex免费迁移。表面上看是收割摇摆用户,但我实测下来发现一个关键细节:Codex的API接口对tool-use的支持其实比Claude更底层。Claude的tool-use是高层封装,你定义好工具schema,它自动帮你调用,但你无法控制调用频率和并行度。而Codex的function calling允许你手动管理调用队列,甚至可以做到部分异步执行。我最近在做一个自动化测试用例生成的Agent,需要同时调用多个微服务接口获取数据,再用这些数据生成断言逻辑。在Claude上,我只能串行调用,每个工具返回后才能继续下一步,导致单次Agent推理的token消耗动辄上万。切换到Codex后,我改成了并行function calling,把多个数据获取请求合并到一个调用批次里,结果token消耗直接降了60%多。这不仅仅是价格问题,更是架构设计上的自由度差异。
不过,帖子里担心的隐形数据训练条款,我建议不要过度焦虑。OpenAI的开发者协议里确实有关于数据使用的条款,但Codex作为专门针对代码场景的模型,它的训练数据策略和GPT系列是分开的。我专门查过他们的隐私政策,Codex的API调用数据默认不会被用于模型训练,除非你主动选择加入共享计划。而且,如果你用的是企业版,还有额外的数据隔离保障。相比之下,Anthropic在这方面的透明度反而更低——他们的条款里有一条“我们可能使用您的输入输出来改进服务”,但没明确说是否包括tool-use的中间调用数据。这对做金融或医疗场景的团队来说,其实是更大的隐患。
再说回成本模型。我觉得这波事件背后,真正值得思考的是:Agent场景的定价权到底应该掌握在谁手里?Anthropic和OpenAI现在都在抢这个位置,但他们的策略截然不同。Anthropic走的是“高单价+强控制”路线,通过提高门槛来筛选用户,本质上是在赌重度开发者会为了模型能力而忍受高成本。OpenAI则是“低单价+宽入口”路线,先用免费迁移吸引用户,再通过后续的增值服务变现。但我觉得这两种策略都有问题。Agent场景的复杂性决定了它不可能有一个统一的定价模型。比如,一个简单的信息检索Agent,每次调用可能只需要1-2次tool-use,成本很低;但一个复杂的多步推理Agent,比如自动生成法律合同并审查条款的那种,可能需要10次以上的tool-use和数千token的上下文。用同样的API单价来覆盖这两种场景,要么是让简单场景的用户为复杂场景买单,要么是逼着复杂场景的用户自己优化。
我自己的做法是,在项目初期就做成本模型推演。具体来说,我搭建了一个成本模拟器,输入Agent的预期调用频率、平均tool-use次数、上下文长度,以及模型的token价格,然后自动生成月度成本曲线。这个模拟器帮我避免了好几次“看起来很美,一算账就亏”的陷阱。比如之前想做一个24小时不间断的客服Agent,每个对话平均需要5次tool-use来查订单、查物流、查退款规则,算下来月成本超过300美元,而那个客户愿意付的月费才50美元。最后我们改成了“半自动模式”:先让Agent处理简单查询,复杂问题自动转人工,这样tool-use次数降到了平均2次,成本才控制在可接受范围内。
另外,我还想提一个很少人讨论的点:Agent的缓存策略对成本的影响。Claude和OpenAI都支持prompt caching,但这个功能在Agent场景里经常被忽略。我做过一个实验,同一个Agent,在启用缓存的情况下,重复调用的token消耗能减少40%以上。具体做法是,把Agent的system prompt和工具定义做成静态部分,只在每次调用时动态拼接用户输入和历史记录。这样,缓存命中率可以从0提升到70%左右。但问题是,Claude的缓存策略比较死板,它只能缓存最近几个请求的prompt,而且缓存的有效期很短。而OpenAI的缓存机制更灵活,你可以手动控制哪些部分需要缓存,甚至可以做到跨会话缓存。这个差异在实际项目中会放大成本差距。
最后,我想说一个更宏观的视角。帖子里提到“ASI决赛圈从模型能力竞争转向了基础设施定价战”,我基本同意,但我觉得还缺一个维度:生态系统的粘性。Anthropic这波操作,看似是在收缩,实际上是在筛选真正愿意为Agent能力付费的硬核开发者。那些因为成本而转向OpenAI的开发者,大概率是价格敏感型用户,他们的流失对Anthropic来说未必是坏事。反过来,OpenAI用免费迁移吸引来的用户,如果只是冲着便宜来的,而没有深度集成到他们的生态里,那等免费期一过,同样会因为价格而再次流失。所以,这场博弈的最终赢家,不是价格最低的那个,而是能让开发者在自己的生态里产生“沉没成本”的那个。比如,如果你在Codex上开发了一套深度依赖其function calling并行能力的Agent框架,那就算以后Claude降价了,你也不愿意再重写一遍。
我现在的策略是双线并行:核心业务继续用Claude的API,但只在那些对模型推理质量要求极高、对成本不太敏感的场景(比如法律合规审查)。而高频率、低价值的Agent任务,比如数据清洗、日志分析、自动化测试,全部迁移到Codex上,并且利用它的并行function calling和灵活的缓存机制来做成本优化。同时,我在密切关注DeepSeek和Mistral的动态,他们在推理成本上的进展可能会改变游戏规则。尤其是DeepSeek的MoE架构,在token效率上已经有明显的优势。如果他们的API价格能降到Claude和OpenAI的一半以下,那这场定价战就真的进入下半场了。
总之,不要只盯着价格数字。真正的高手,是在理解模型能力边界和成本结构的基础上,重新设计Agent的架构,把每一分钱都花在刀刃上。那些抱怨“成本崩盘”的,大概率是在用对话模型的思路做Agent,没有经历过从“玩具”到“产品”的阵痛。我踩过的坑比你想象的多得多,但每次优化后,我都觉得自己的架构能力又提升了一个台阶。这才是这波定价战给我的最大收获。
这波确实疼,我这边有个跑了两三个月的自动化流水线,之前用Claude的Agent SDK搭的,每天大概几千次tool call,算下来一个月订阅费就能cover。新政一出来我去算了下,按API零售价走,同样的调用量直接翻到五倍以上,而且这还是没算多轮对话里反复触发上下文重置的开销。说实话,Anthropic这个动作有点自断臂膀的意思,Agent生态刚有点起色,开发者社区里不少人在用Claude做复杂任务编排,现在成本模型直接崩了,很多人估计得停项目观望。
OpenAI那边Codex的免费迁移确实是个诱饵,但我之前试过,Codex在tool-use的灵活性和上下文一致性上跟Claude比还是有差距,尤其在多步推理场景下,Claude对中间结果的记忆和纠错能力明显更强。现在问题是,如果硬着头皮留在Claude上,就得重新设计调用逻辑,比如减少无意义的上下文填充,或者把部分轻量级推理切到别的模型上做预处理,但这样架构复杂度又上去了,小团队根本折腾不起。
我倒是好奇,Anthropic这次收缩是不是在憋什么大招?比如后续推专用的推理优化实例或者批量调用套餐?不然光靠API零售价,重度用户根本扛不住,生态流失是迟早的事。
同感,之前用Claude搭自动化流水线,日均API调用量不小,这波政策一出来我直接暂停了agent项目,算了一笔账发现成本涨了快8倍。OpenAI这时候送Codex两个月免费,摆明了是在抢Claude的存量用户,但说实话Codex的tool-use生态成熟度跟Claude差一截,迁移成本也不低。现在就看谁先把推理效率的瓶颈打穿了,不然纯拼定价谁都扛不住。