AI能提效不假,但账单却越来越看不懂了。一位名叫Michael Hahn的前Oracle总监,最近干起了一门打假AI账单的生意。他的公司Vaudit翻了60家企业、约3400万美元的AI账单,从里面揪出约170万美元的多收费用,大头是Claude Code的使用费。被审计的客户名单中不乏松下、HP、本田这样的企业。可你要是去问账单另一头那两位AI巨头,得到的回答是另一个版本:Anthropic说,自己不为没完成的请求或报错计费,也不会把请求偷偷路由到旧模型;OpenAI更干脆,称没有证据显示这些问题发生在自家客户身上。两边都说没问题,但经过Vaudit和客户一轮轮申诉,这些争议金额里,约80%最后被Amazon、Google、Microsoft、Anthropic和OpenAI退了回来。Hahn说这些公司在出问题时配合度非常高,同意退钱,却不同意认错。于是情形就奇怪起来:审计公司拿着账本说「我查出来了」,约80%的超额费用也被退还了,模型厂商集体摆手说「没这回事」。既然都说没错,这钱,是怎么退出来的?Vaudit查出了三种最常见的多收方式,每一种都藏在账单不起眼的角落。第一种是模型张冠李戴:客户实际调用的是更旧、更便宜的模型,账单却按更新、更贵的那一档来算,一次两次看不出来,跑上几百万次调用,差价就出来了。第二种是为失败买单:智能体或聊天机器人没完成请求、甚至直接报了错,这部分照样进了账单。第三种最隐蔽,Hahn管它叫重试风暴:一个智能体任务失败了,它不声不响地自己反复重试,用户根本不知道后台在烧钱,费用就这么一层层叠上去。这三种里没有一种是用户「主动多用」造成的。最让人担忧的是第三种:过去你用软件,是一步一点、自己盯着的,一旦跑飞了立刻就能掐断。可AI智能体的卖点恰恰是「放手让它自己干」,人退到了流程之外。这意味着当AI智能体在后台撞墙、重试、再撞墙,狂烧token时,那个原本会喊停的人根本不知道,而账单却要等到月底才送到你面前。这件事的重点,不是「谁骗了谁」。Vaudit查到了,但Anthropic、OpenAI没认,这本就是审计公司的口径,谁也不能凭一句「查出170万」,就给两家公司扣上乱收费的帽子。但退款这一步,每一家倒也配合。能一口气退掉八成,恰恰说明这八成本就不该收。退款是纠错,钱退了,账还是笔糊涂账。之所以会出现这种「退钱不认账」的僵局,根子在AI计费这门生意本身的算法上。问题可能不在「算错」,而在「天生算不清」。因为它按token用量计费,你用得多就付得多,用得复杂就付得更多,可token在你常用的那些基础设施仪表盘里,基本是隐形的。更麻烦的是,它还会剧烈波动:同样问一句话,用哪个模型、prompt怎么写、智能体怎么编排,烧掉的token能差出好几个量级。模型越往「智能体化」方向走,越吃token。一个智能体替你跑一个任务,背后可能是几十上百次模型调用,每一次都在烧钱。天生难预测、难解释,「多收」的模糊地带就是这么留出来的。Hahn的话一针见血:AI账单,正变得越来越不透明。这句话刚好戳中了整个行业的软肋。AI从最早的「按调用计费」,一路走到今天的「多模型+多智能体+云中转」,账单的链条被拉得越来越长:模型厂商收一道,云厂商收一道,中间夹着的SDK代理再绕一道。每一道单看都合理,可三道叠在一起,很难一眼看清这笔钱究竟花在了哪。更要命的是,钱往往不烧在你看得见的地方。真正吃账单的那些场景,几乎都藏在后台,而且每一种都有公开的GitHub issue或事故报告可查。要么是上下文一遍遍重传,要么是子智能体趁没人盯着通宵空转,账单就在你看不见的地方,自己越滚越大。Anthropic遭遇AI账单的挑战不止一次。就在6月15日,一位华盛顿特区的客户Karl Kahn,把Anthropic告上了联邦法院,指控它在高价订阅上「货不对板」。据《华尔街日报》报道,Anthropic的Max 5x每月100美元,Max 20x每月200美元,宣传时的卖点,是Pro计划用量上限的5倍和20倍。可Kahn说,实际能用的量远远低于宣传。对于AI从业者来说,这起事件是一个清晰的警示:在拥抱智能体化带来的效率提升时,必须建立对AI账单的主动监控机制,否则,那些藏在后台的token消耗,可能会让你的成本失控于无形。