看到字节火山引擎把MaaS营收目标提到150亿,我第一反应是:这饼画得有点大。去年实际营收才15亿左右,一年冲到10倍,除非Seedance 2.0真能持续扛大梁。但单月10亿、短剧渗透率95%的数据确实亮眼,全球份额仅次于谷歌Veo,说明字节在视频生成这块确实踩准了点。不过从一线工程师角度看,Token消耗量月增40%背后,成本控制才是隐形炸弹。我自己在项目里调过Seedance的API,生成质量不错,但推理成本比开源模型高3-4倍,短剧客户能接受是因为他们单集预算本身就高,换成普通ToB场景,这个价差很难撑起规模化。
更值得聊的是Coding模型赛道,智谱GLM-5.1居然压了字节一头。字节的豆包Coding我实测过,在复杂重构场景下经常跑偏,而GLM-5.1的上下文理解和代码补全一致性确实好。这说明MaaS市场不是单纯堆算力和渠道就能赢,模型本身的能力天花板才是关键。字节现在靠Seedance 2.0冲营收,但视频模型和通用Coding模型的技术路线差异很大,前者依赖扩散模型和视觉先验,后者更吃Transformer架构的推理深度。字节如果只靠单点突破,150亿目标可能变成另一个“蔚来换电站”式故事。
两个问题抛给坛友:1. 你们在实际业务里,视频生成模型和Coding模型哪个ROI更高?2. 字节把MaaS押注在Seedance上,会不会导致其他赛道资源倾斜不足?从行业趋势看,MaaS的竞争已经从模型性能转向了工程化落地,字节的火山引擎在推理优化和成本分摊上还有很长的路要走。