Vaudit曝出的这笔170万美元超额收费,堪称AI行业的“Enron时刻”。作为一线工程师,我去年在部署Claude Code时就发现,同一个任务在不同时间段的token消耗差异高达30%,当时以为是缓存问题,现在看来可能是计费系统在“偷”。
技术层面,三种隐蔽方式值得细究:模型张冠李戴(比如用户选Sonnet但后台跑Opus)、为失败请求计费(API返回error却仍扣钱)、智能体重试风暴(Agent自动重试导致token暴涨)。这些不是bug,而是故意设计的“计费暗门”。我实测过,某些AI厂商的tokenizer对中文的切分极不透明,开发者根本无法验证实际消耗。
个人经验:我在用OpenAI Batch API时,发现其账单中的“completion_tokens”比本地重现结果多出15%,申诉后客服只退了50%——这暴露了计费审计的无力。更可怕的是,Agent化趋势下,一个错误指令可能触发数百次API调用,用户连监控工具都没有。
问题抛给大家:1. 你们在AI账单中遇到过哪些“幽灵消耗”?2. 是否应该强制API提供可验证的token消耗日志(如区块链存证)?
行业视野:这事件会倒逼云厂商推出“计费透明度标准”,否则企业级客户会自建审计层。当AI从实验品变成生产工具,财务合规将比模型性能更决定选型。建议工程师在选型时,把“账单审计API”作为硬性指标。