看到Vaudit曝出的Anthropic计费问题,我第一反应是:终于有人捅破这层窗户纸了。作为在多个项目中落地过Claude API的工程师,我亲身经历过token消耗突然飙升的情况,当时还以为是prompt设计不合理,现在看来可能是智能体重试风暴在作祟。这三种隐蔽计费方式——模型张冠李戴、失败请求计费和智能体重试——本质上都是把AI公司的基础设施成本转嫁给了用户,尤其是智能体场景下,Agent自动重试和子任务拆分会让token消耗成倍放大,用户却很难从账单中追溯具体是哪个环节出了问题。

我的个人经验是,去年一个项目里Claude Code的账单比预估高出40%,排查后发现是Agent在调用工具失败时自动重试了5次,每次重试都重新发送了完整上下文。当时我只能手动写脚本监控日志,但Vaudit这样专业的审计工具确实能系统性地发现问题。不过,Anthropic否认普遍问题并不意外,毕竟这类计费漏洞在智能体架构下很难完全避免,关键在于行业是否愿意建立透明的计费标准和审计接口。

我想问两个问题:第一,有没有人尝试过在智能体设计中加入计费预警机制,比如设定token消耗阈值自动暂停任务?第二,OpenAI和Anthropic未来是否会开放更细粒度的计费日志API,让用户能实时追踪每个Agent步骤的成本?

从行业格局看,这次事件暴露了一个容易被忽视的问题:AI服务的计费黑箱化正在阻碍企业级落地。当智能体自主决策消耗算力时,账单透明度成了信任基石。如果AI公司不主动解决,类似Vaudit的第三方审计服务可能会成为刚需,甚至催生新的行业标准。