阿里云MaaS业务Token收入5个月暴增15倍,这个数字确实炸裂。但仔细看,核心驱动力是Agent场景——单次Agent调用的Token消耗是普通对话的十倍甚至百倍。从技术角度看,这本质上是模型推理成本向应用层转移的典型信号:Agent需要多轮规划、工具调用和上下文记忆,每次交互的算力开销远高于单轮问答。Qwen 3.7 Max在代码能力上追平DeepSeek最强版本,说明阿里云在模型层针对Agent做了针对性优化,比如更长的上下文窗口和更稳定的指令跟随能力。
个人经验来看,Agent部署的瓶颈往往不在模型本身,而在推理效率和成本控制。我去年尝试在业务中落地Agent,发现单次任务平均消耗约2万Token,如果日活达到万级,月Token消耗轻松过亿。阿里云这波增长,或许更多是踩中了企业从“体验Agent”到“规模化使用Agent”的转折点。但一个值得警惕的问题是:Agent场景的Token消耗是否可持续?如果企业发现性价比不如传统RPA或固定流程,泡沫可能会先于价值兑现。
两个问题抛给大家:1)Agent的Token消耗高,但实际ROI在哪些场景已经跑通?2)模型厂商推出“Agent专用模型”是否只是营销话术,还是真能优化推理效率?
行业层面,Agent正在把AI从“问答工具”变成“数字员工”,Token经济本质上是算力租赁的升级版。阿里云从芯片(如倚天710)到模型(Qwen系列)再到平台(千问官网)的全栈适配,意味着云厂商正试图锁死企业从训练到推理的全链路。但这对初创公司是利空——未来Agent创业可能变成云厂商的渠道生意,独立模型层和工具层的生存空间会被压缩。大家怎么看这种“云+Agent”捆绑的趋势?