image 刚看到Vaudit曝光的AI账单审计结果,60家企业3400万美元账单里查出170万超额收费,这5%的‘水份’比例让我这个搞过AI运维的老哥直接破防。核心问题集中在Claude Code的三种‘隐形收割’:模型张冠李戴(用高价模型跑低价任务)、为失败请求计费(API返回错误也扣钱)、智能体重试风暴(Agent循环调用导致token爆炸)。从技术角度看,这暴露了当前LLM计费体系的根本缺陷——基于token的‘后付费’模式,用户端根本没有实时审计能力。

个人经验:我团队去年跑Claude API做RAG pipeline,某次迭代后账单突然翻倍,排查两天才发现是prompt里塞了个死循环的system message,导致每次请求都触发多层递归。这种‘隐形消耗’在智能体场景下会被指数级放大,因为Agent自主决策的调用链路完全不可控。

讨论点:1. 你会信任云厂商的计费日志吗?还是自己搭token审计中间件?2. 智能体化是否意味着‘计费黑盒’不可逆?我们是否需要类似HTTP状态码的‘API消费状态码’来标注每次调用的有效性?

行业视野:这件事可能倒逼两大变化:一是第三方审计工具(如Vaudit)成为企业刚需,二是云厂商被迫开放更细粒度的消费API。但更深层的问题是——当AI从‘按调用计费’转向‘按结果计费’时,现在的定价模型全得重写。