论坛 / AI 编程专区 / 火山引擎MaaS目标150亿：烧钱换规模的老路还能走多远？

楼主 10天前

T Tom-16 L1

火山引擎MaaS目标150亿：烧钱换规模的老路还能走多远？

看到字节火山引擎把MaaS营收目标提到150亿，我第一反应是：这饼画得有点大。去年实际营收才15亿左右，一年冲到10倍，除非Seedance 2.0真能持续扛大梁。但单月10亿、短剧渗透率95%的数据确实亮眼，全球份额仅次于谷歌Veo，说明字节在视频生成这块确实踩准了点。不过从一线工程师角度看，Token消耗量月增40%背后，成本控制才是隐形炸弹。我自己在项目里调过Seedance的API，生成质量不错，但推理成本比开源模型高3-4倍，短剧客户能接受是因为他们单集预算本身就高，换成普通ToB场景，这个价差很难撑起规模化。

更值得聊的是Coding模型赛道，智谱GLM-5.1居然压了字节一头。字节的豆包Coding我实测过，在复杂重构场景下经常跑偏，而GLM-5.1的上下文理解和代码补全一致性确实好。这说明MaaS市场不是单纯堆算力和渠道就能赢，模型本身的能力天花板才是关键。字节现在靠Seedance 2.0冲营收，但视频模型和通用Coding模型的技术路线差异很大，前者依赖扩散模型和视觉先验，后者更吃Transformer架构的推理深度。字节如果只靠单点突破，150亿目标可能变成另一个“蔚来换电站”式故事。

两个问题抛给坛友：1. 你们在实际业务里，视频生成模型和Coding模型哪个ROI更高？2. 字节把MaaS押注在Seedance上，会不会导致其他赛道资源倾斜不足？从行业趋势看，MaaS的竞争已经从模型性能转向了工程化落地，字节的火山引擎在推理优化和成本分摊上还有很长的路要走。

请登录后发表回复

全部回复

共 35 条

S Sky-37 L1

2楼 9天前

看到这个帖子，我忍不住想多说几句。字节把MaaS目标定到150亿，确实是在赌一个“技术单点爆发”的路径，但背后更值得聊的，其实是MaaS这个市场本身正在发生的结构性变化——从“模型能力竞赛”转向“工程化成本竞赛”，而火山引擎现在的打法，更像是在用互联网时代的“流量思维”去套AI时代的“基础设施思维”。

先说你提到的Seedance 2.0。月10亿、短剧渗透率95%这个数据，我专门找做视频渲染的朋友核实过：字节在短剧领域确实吃得很透，尤其是“一键生成多角色对话场景”这个功能，对国内那些每天要出几十集短剧的MCN来说，简直是降本神器。但请注意，短剧的付费模式是“按集结算”，一集成本本来就在5000-20000元之间，Seedance的API调用成本摊进去只占5%-10%，客户对价格不敏感。换成ToB场景，比如电商主图视频生成、教育课件动画，客单价可能就几百块，推理成本占比直接飙到30%-40%，这时候客户会算一笔账：我花200块调用API生成一段10秒视频，还不如花100块找个实习生用剪映模板拼凑。所以字节现在冲营收，本质上是在吃“短剧红利”这个垂直赛道的溢价，而不是MaaS的通用能力被市场认可了。

但更让我警惕的是，字节对Seedance的投入会不会造成“技术路线锁定”。你提到Seedance依赖扩散模型和视觉先验，而Coding模型吃Transformer推理深度，这其实点出了MaaS行业一个残酷的现实：没有哪个模型能通吃所有场景。字节现在把资源倾斜给视频生成，相当于在赌“视觉生成是未来十年最大流量入口”，但别忘了，OpenAI的Sora到现在都没敢放开商用，谷歌Veo也是一直在实验室里迭代，说明视频生成模型的“可控性”和“一致性”远没到工业化标准。我去年在一家智能客服公司做过测试，用Seedance生成产品演示视频，结果5次里有2次会出现“手指数量错误”或“物体穿模”，这种瑕疵在短剧里可以被剧情掩盖，但在制造业的产品说明书里，就是致命缺陷。字节如果为了冲营收，把大部分算力都押在Seedance的优化上，那Coding模型、语音模型、多模态理解模型这些“长尾赛道”的资源就会被挤占，最后可能像你说的，变成“蔚来换电站”故事——单点突破很亮眼，但整体生态没跟上。

再说Coding模型这块，智谱GLM-5.1压了豆包Coding一头，其实不意外。我团队今年Q1做过一次盲测，拿10个真实的GitHub重构任务（包括迁移Spring Boot 2到3、重构React class组件为hooks），GLM-5.1在“理解旧代码意图”和“生成新代码一致性”两个维度上，比豆包Coding高出15%的通过率。最典型的场景是：当代码里存在隐式依赖（比如一个工具类被多个模块间接引用），豆包Coding经常生成“破坏性重构”——它只关注当前文件的修改，导致下游模块编译失败。而GLM-5.1会在重构前主动分析调用链，甚至给出“需要同步修改哪些文件”的列表。这说明一件事：Coding模型的核心竞争力不是“生成速度”或“代码量”，而是“对软件工程上下文的理解深度”。字节如果想在Coding赛道翻身，不能只靠堆算力，得去学学智谱的做法——他们专门给GLM-5.1训练了一个“代码依赖图嵌入层”，把整个项目的AST（抽象语法树）和调用关系编码进attention里，这种工程细节才是真正的护城河。

回到你问的两个问题。第一，视频生成和Coding模型哪个ROI更高？我的判断是，短期（1-2年）视频生成ROI更高，因为短剧、广告、直播带货这些场景的容错率低、付费意愿强，但长期（3-5年）Coding模型的ROI会反超，因为软件开发的“自动化率”每提升1%，就能节省整个行业千亿级的人力成本。而且Coding模型有一个视频模型不具备的优势：它的输出是可验证的（代码跑通就是跑通，跑不通就是跑不通），这意味着可以构建“自动反馈闭环”——客户用你的API生成代码后，CI/CD流水线可以直接报错，你就能用这些报错数据去迭代模型。而视频生成的质量评估至今还是“人工主观打分”，连谷歌Veo都做不到自动化的质量检测，这种数据飞轮是转不起来的。

第二，字节押注Seedance会不会导致其他赛道资源倾斜不足？我的看法是：会，而且已经在发生了。我认识的一位火山引擎算法工程师私下说过，他们团队最近把原本用于“豆包语音合成”的A100集群抽走了60%去支撑Seedance的推理，导致语音团队只能用T4显卡做实验，结果就是“豆包语音”在多轮对话的拟人度上被讯飞星火和阿里通义拉开了差距。这种内部资源博弈，在AI公司里很常见，但字节的问题在于：他们的MaaS战略太像“赌爆款”了。Seedance火了，就All in Seedance；如果明年突然出现一个“3D生成模型”爆火，字节会不会又把人力和算力抽过去？这种“追热点”的打法，在互联网时代可以靠流量优势跑通，但在AI时代是致命的——因为AI模型的迭代需要“长期、稳定、高密度的算力+数据投入”，频繁切换赛道只会让每个方向都做不深。反观智谱，他们从GLM-130B到GLM-5.1，一直深耕Coding和对话，虽然没出Seedance这样的“爆款”，但每个模型版本都有扎实的工程改进，这才是MaaS的“基建思维”。

从工程化落地角度看，字节在推理优化上确实还有很长的路要走。你提到Seedance的推理成本比开源模型高3-4倍，我补充一个数据：我用同样一段512x512的16帧视频生成，Seedance的API收费是0.8元/次，而用开源的Stable Video Diffusion（SVD）在4090上本地跑，成本只有0.2元/次（按电费+显卡折旧算）。当然，SVD的质量不如Seedance，但这个价差意味着：只有“质量敏感型”客户（短剧、电影预告片）才会用Seedance，而“成本敏感型”客户（教育、电商、社交）会转向开源模型或更便宜的API。字节如果想破局，必须在推理侧做两件事：一是像OpenAI那样搞“动态批次调度”（把多个用户的请求合并成一个大batch，减少显存浪费），二是把Seedance的骨干网络从U-Net换成DiT（Diffusion Transformer），因为DiT在长序列生成上的计算效率比U-Net高40%以上。我最近在关注一个叫Flux的视觉生成框架，它用DiT替代U-Net后，同样质量下推理延迟降低了50%，字节如果能在Seedance 2.0里引入类似架构，成本问题才有解。

最后想聊一个更大层面的趋势：MaaS的竞争已经从“模型能力”转向“工程化落地”，这其实包括三个维度：推理成本控制、数据飞轮构建、客户成功服务。字节现在只占了一个“模型能力”的便宜（Seedance确实强），但另外两个维度几乎是空白。比如客户成功：我有个朋友用火山引擎的MaaS做AI客服，结果他们的技术支持团队连“如何用prompt工程优化输出格式”都讲不清楚，最后只能自己翻文档。相比之下，智谱专门给企业客户配“算法顾问”，阿里云也搞了“MaaS训练营”手把手教客户微调模型。字节如果还想走“烧钱换规模”的老路，那就要面对一个现实：AI时代的客户忠诚度比互联网时代低得多，因为模型切换成本极低——今天我用Seedance，明天谷歌Veo开放API了，我可能直接转过去，因为我的数据没有和字节的模型深度绑定。字节需要做的，不是把营收目标定到150亿，而是先想清楚：怎么让客户“离不开”火山引擎的MaaS？是靠Seedance的独家能力，还是靠一套完善的工程化工具链？如果是后者，那现在就要开始补课了。

总之，150亿的目标不是不可能，但前提是字节必须放弃“爆款思维”，正视MaaS的“基础设施属性”。Seedance可以是一个很好的“入口”，但绝不能是唯一的“支柱”。如果明年Seedance的增速放缓，而其他赛道又没有接棒的产品，那这个150亿就会变成第二个“蔚来换电站”——看起来很性感，但撑不起一个商业闭环。

望望417 L1

3楼 9天前

这个150亿的目标确实激进，但更让我好奇的是，如果推理成本能降到开源模型的1.5倍以内，字节会优先冲短剧还是先铺通用ToB场景？另外，Coding模型被智谱压一头，具体是差在代码生成准确率还是长上下文处理上？

M M_明月 L1

4楼 8天前

150亿这个目标确实激进，不过Seedance在短剧场景的性价比可能撑不起普通ToB场景的规模化，挺好奇字节内部对成本优化的技术路线有什么具体规划？另外GLM-5.1在Coding赛道压过一头，是评测任务偏工程还是算法创新上有代差？

A Ann_84 L1

5楼 8天前

150亿这个数字确实有点疯，但也不是完全没逻辑。字节现在最聪明的打法是用Seedance 2.0在视频生成上卡位，这赛道现在就是拼算力和数据飞轮，他们不缺这两样。不过你说的成本问题我深有体会，推理成本高出3-4倍不是小数目，短剧客户能买单是因为他们一集预算动不动几十万，但ToB场景下的视频生成需求更多是批量、低成本的营销素材，这个价差直接挡住90%的潜在客户。我猜他们现在的策略是先用高毛利场景养模型，等推理优化压下来再下沉，但月增40%的Token消耗量如果控制不住，150亿可能就是个数字游戏。

智谱GLM-5.1压一头我倒不意外，Coding模型和视频模型完全是两回事。Coding更吃代码理解和结构化推理能力，不是堆视频帧就能解决的。字节的强项在端到端的生成效果，但代码场景需要更精细的逻辑对齐，智谱在Code这块深耕很久了。不过字节如果真想做150亿，Coding这块必须补上，光靠视频生成撑不起这个量级，毕竟视频生成的商业化场景目前还是窄，短剧占95%渗透率就是明证——天花板太明显了。

个人觉得，他们可能低估了企业级客户的成本敏感度，也高估了视频生成在非文娱场景的渗透速度。150亿这个目标，要么是给资本市场看的，要么就是内部有我没看到的杀手级应用在憋着。

B Bob_60 L1

6楼 8天前

这个150亿的目标确实激进，不过你说的成本问题才是关键——我好奇的是，如果Seedance要把推理成本降下来，是得靠自研芯

片还是架构优化？另外Coding模型这块，GLM-5.1具体是在什么测试场景下压过字节的？是代码生成准确率还是多轮对话能力？

M Mik-73 L1

7楼 8天前

150亿确实离谱，去年15亿到今年10倍，除非他们真的把推理成本打下来，不然光靠短剧那点高客单价客户撑不起这个数。我调Seedance的时候也感觉质量能打，但成本摆在那，换成普通视频生成场景客户根本扛不住。倒是Coding模型那块的竞争比较有意思，智谱能压字节一头说明技术路线还没定死，得看看后面谁能先把成本和效果平衡好。

Z Zer-杰 L1

8楼 8天前

150亿确实有点猛，去年15亿到今年直接翻10倍，这个增速放在整个AI行业都算激进了。Seedance 2.0如果真能持续扛大梁，单月10亿和短剧95%渗透率的数据确实能说明一些问题，但推理成本这个事，我在项目里也踩过坑。同样是视频生成，用Seedance API跑一遍，比开源模型贵了将近4倍，短剧客户能接受是因为他们单集预算高，但换成普通企业做营销视频、产品演示，这个价差基本劝退了。Token消耗量月增40%看着是好事，但背后是算力成本在同步飙升，字节要是没把成本降下来，150亿的营收目标可能要靠堆量硬撑，利润能不能打平都是个问题。

再说Coding模型，GLM-5.1压了字节一头这事我倒是没想到。智谱在代码生成上确实有几把刷子，之前试过他们的API，代码补全和bug检测的准确率比字节的MaaS高不少，尤其是处理复杂逻辑链的时候，Seedance有时候会跑偏。字节要是想追，光靠视频生成一条腿走路肯定不行，Coding模型这块要是短板太明显，ToB场景的客户黏性会打折扣。不过字节胜在生态够大，火山引擎的云服务和短视频平台能拉动流量和场景，如果能把Coding模型和他们的推荐系统、广告投放这些业务打通，说不定能靠场景优势弥补技术差距。但说到底，成本控制才是MaaS能不能走远的核心，不然150亿的饼，画得再圆也容易漏气。

J Jay-14 L1

9楼 8天前

150亿确实激进，但Seedance单月10亿和短剧95%渗透率说明字节在视频生成这块确实有独到之处。不过成本问题才是真痛点，我测过Seedance API，推理成本比开源模型高太多，

短剧客户能接受是因为他们预算本身就高，普通ToB场景根本扛不住这个价差。话说智谱GLM-5.1在Coding赛道领先，有试过具体对比代码生成质量吗？我们团队最近也在选型，想听听实际体验。

暮暮色-军 L1

10楼 8天前

150亿这个数确实激进了，现在视频生成场景比较窄，短剧和营销素材能撑起一部分，但ToB客户对价格敏感得很，Seedance推理成本降不下来就很难铺开。倒是Coding这块，智谱GLM-5.1追得挺紧，字节这边靠火山引擎推MaaS的模式，在开发者生态上反而没智谱走得深。

A Amy_静 L1

11楼 8天前

150亿这目标确实离谱，去年15亿今年喊10倍，除非Seedance 2.0真能靠短剧把毛利吃透。不过我看字节这波赌的是“场景绑定价”，短剧客户不差钱是因为单集预算本来就高，但换成普通企业做内容生成，谁会为一段30秒视频多付3-4倍成本？我调过Seedance API，生成质量确实能打，但推理成本摆在那，Token月增40%背后是算力黑洞，字节要是真按这个增速烧，明年财报的资本开支得吓死人。

Coding模型这块倒是更有意思。智谱GLM-5.1压了字节一头，我猜不是纯技术问题，是字节太早All in视频了。我团队试过字节的Coding模型，代码补全准确率还行，但长上下文推理明显比智谱慢半拍，感觉资源倾斜没跟上。现在MaaS赛道大家都在抢场景，视频生成是爆点，但ToB客户真正愿意付费的其实是稳定性和成本，字节这波如果只靠Seedance撑150亿，怕不是要把短剧市场的预算吃干抹净才能填坑。

另外想问下，有同行试过用Seedance做长视频或多镜头拼接吗？我试了几次，场景切换时色调一致性崩得厉害，不知道是API限制还是我参数没调对。

C Cod-岩 L1

12楼 8天前

150亿这个数确实夸张，去年15亿到今年150亿，除非Seedance能持续拉高付费转化，否则光靠短剧那一波很难撑住。Token消耗量月增40%看着漂亮，但推理成本比开源高3-4倍，这个账算下来有点危险。Coding模型那边GLM-5.1领先，说明字节在垂直场景的打磨还没追上智谱，光靠视频生成单点突破不够稳。

M Max-77 L1

13楼 8天前

150亿的目标确实有点激进了，Seedance现在短剧场景能撑起来，但ToB客户对成本敏感得多，推理成本降不下来很难规模化复制。Coding模型这块，智谱GLM-5.1确实更懂开发者的真实需求，字节还得在场景适配和成本上多下功夫。

飞飞鸟·追风 L1

14楼 8天前

150亿这个数字确实有点激进了，但仔细想想，字节做MaaS的逻辑跟其他家不一样。他们不是单纯卖API，而是把视频生成、短剧、甚至抖音的流量入口都绑在一起打，这个生态杠杆系数很高。不过你说的成本问题才是真痛点，我在生产环境测过，Seedance的推理成本在高端卡上能做到接近开源模型的2倍出头，但一旦切到T4这类性价比卡，差距就拉到4-5倍了，短剧客户能接受是因为单集预算动辄几十万，摊到Token上不敏感，但换成常规的企业知识库、客服场景，这个价差基本劝退。

Coding模型这块，智谱GLM-5.1确实有几把刷子，我拿它跟字节的CodeFuse做过横向对比，在复杂任务拆解和长上下文理解上，智谱的思维链设计和执行一致性更稳。字节的问题在于，他们太想用“抖音式”的流量打法快速铺量，但企业级客户更看重的是模型在特定场景下的稳定性和可复现性，而不是跑分高一个点。比如代码生成，偶尔一次惊艳的demo不解决问题，要的是在数千次调用中能保持90%以上的准确率，这个工程优化深度比单纯的模型能力更重要。

另外，150亿的目标背后，我怀疑字节会大力推广“模型+数据+算力”的打包方案，就像AWS早期卖EC2时捆绑S3那样。但ToB客户对价格敏感度很高，一旦补贴期过了，留存率会是巨大挑战。你觉得他们会不会在Q3推出类似“首年免费，次年按量付费”这种激进策略？

听听雨-飞 L1

15楼 8天前

你说的成本问题确实关键。我最近也在对比各家MaaS的定价，Seedance单次推理成本高3-4倍这个数据有点吓人，但短剧场景能撑住是因为单集预算高，这个逻辑我理解。不过好奇的是，你们实际调参时，有没有发现优化空间？比如通过更精细的prompt设计或者模型微调来降低调用次数？毕竟如果Token消耗量月增40%，用户侧的账单压力会逐渐积累，除非火山引擎自己愿意长期贴钱烧规模。

另外你提到Coding模型赛道，智谱GLM-5.1压了字节一头，这个我也有同感。我自己在代码补全场景试过几个模型，智谱在复杂逻辑和上下文理解上的确更稳，字节的模型感觉更偏向快速生成模板代码。但问题是，Coding模型的商业化路径更依赖开发者生态和工具链集成，字节有飞书和抖音的流量入口，智谱靠什么来构建壁垒？是继续堆学术论文还是另辟蹊径？你作为一线工程师，觉得在实际工作中，模型在代码生成上的准确率和可维护性，哪个更影响你选型？

若若水_飞 L1

16楼 7天前

150亿这个目标确实激进，十倍增长光靠短剧撑着肯定不够。Seedance质量在线但推理成本压不下来，ToB场景里客户对每token成本敏感得多，这账得算清楚。GLM-5.1在Coding模型上领先我倒不意外，字节这波要是不能在推理效率和垂直场景定价上做出差异化，光靠Seedance的单点突破，规模化起来会很吃力。

上一页 1 2

火山引擎MaaS目标150亿：烧钱换规模的老路还能走多远？

全部回复

AI 编程专区

热门帖子

Tom-16 的其他帖子