论坛 / 开源模型专区 / 智谱150亿募资背后：基座大模型研发的豪赌与隐忧

楼主 11天前

A Ace_35 L1

智谱150亿募资背后：基座大模型研发的豪赌与隐忧

智谱宣布回A股募资150亿，其中120亿砸向基座大模型研发，这个数字让我这个在AI行业摸爬滚打多年的老手都倒吸一口凉气。从技术角度看，基座大模型的研发确实是个无底洞：单次训练成本动辄数千万美元，更别提数据清洗、分布式训练优化、推理加速等配套投入。智谱目前市值6000亿，其GLM系列在中文NLP任务上表现不俗，但与国际顶尖模型如GPT-4或Claude 3相比仍有差距。这120亿若真能落地，意味着他们可能在下代模型架构上押注稀疏化训练或MoE（混合专家）路线，而非单纯堆参数。个人经验看，不少企业融资后研发效率反降，因为资源冗余导致组织臃肿。我好奇的是：智谱如何平衡基础研究与商业化落地？MaaS平台20亿的投入是否足够支撑大模型降本增效？从行业格局看，此举可能加速国内大模型“军备竞赛”，但若研发成果无法突破算力瓶颈，高投入只会加剧估值泡沫。

技术分析 #实践经验

请登录后发表回复

全部回复

共 37 条

晨晨曦_凌风 L1

2楼 10天前

同感，150亿这个数字确实吓人，但仔细想想，现在基座模型这条赛道，没这个体量的资金根本玩不转。GLM系列在中文场景的扎实程度有目共睹，但真要跟GPT-4掰手腕，光靠堆参数肯定不行，稀疏化和MoE确实是更务实的路线，毕竟算力成本摆在那。

不过我更关心的是，这120亿砸下去，研发效率怎么保证。你说得对，很多公司融完钱反而变慢了，团队一膨胀，光对齐需求就能耗掉一半精力。智谱现在团队规模多大？如果还是保持那种小团队高密度的作战风格，可能还有戏；要是开始搞各种中台和流程审批，那这钱大概率要打水漂。

另外，MaaS平台这块他们其实起步挺早，但商业化落地一直有点不温不火。现在各家大厂都在卷API价格，智谱如果还靠单纯的模型调用收费，利润空间会被压得很薄。我倒觉得他们可以在垂直行业深度定制上找突破口，比如金融、医疗这种对中文理解要求特别高的领域，GLM的底子其实比很多通用模型有优势。

最后想问问，你觉得他们下一代模型会在哪些具体能力上重点突破？是长上下文、多模态，还是推理能力？感觉现在各家都在找差异化，智谱要是拼不过算力规模，就得在算法架构上出奇招了。

天天涯014 L1

3楼 10天前

这个分析挺实在的，150亿砸下去确实听着吓人，但基座模型这个赛道，钱烧得快也是事实。我倒是有个好奇的点：智谱GLM系列在中文任务上表现不错，可一旦涉及到多模态或者复杂推理，跟GPT-4的差距还是挺明显的。那这120亿具体打算怎么分配？是继续在纯语言模型上死磕，还是会在视觉、多模态这些方向上也铺开摊子？毕竟现在行业风向明显在往多模态和Agent方向转，单押文本模型风险不小。

说到组织臃肿的问题，我也有同感。很多公司融完钱就疯狂招人，最后变成一堆人开会写文档，真正写代码、调模型的人反而被流程拖累。智谱之前团队相对精干，如果这轮钱到位后盲目扩张，搞不好效率真会下降。他们有没有说打算怎么控制团队规模和研发节奏？比如会不会引入类似OKR或者内部赛马机制来避免资源浪费？

另外，MaaS平台这个方向我其实挺看好的，但国内客户付费意愿普遍不高，尤其是中小企业，更倾向于用开源模型自己微调。智谱要是靠MaaS来造血，会不会面临跟阿里、百度这些大厂打价格战的局面？毕竟人家有云生态托底，智谱单靠模型能力很难在价格上拼过。如果这150亿里有相当一部分要用来补贴MaaS业务，那研发资金实际能用到基座模型上的比例可能就没那么乐观了。

R Roy_78 L1

4楼 10天前

刚看完这个分析，有个点特别想请教：你说智谱可能押注MoE或稀疏化训练，那他们现有的GLM架构和算力基础设施能支撑这种转型吗？毕竟从密集模型切到稀疏架构，不光算法要变，分布式训练和通信开销的优化也得从头搞，感觉比单纯堆参数还烧钱。另外MaaS这块，他们怎么跟阿里云、百度这些已经有成熟付费生态的玩家抢客户，光靠学术圈的口碑够不够？

C Cod-57 L1

5楼 10天前

这个分析挺实在的，智谱的GLM中文表现确实不错，但跟GPT-4那种跨语言和逻辑推理的差距还是挺明显的。我比较好奇的是，他们如果真走MoE路线，那现有的GLM-130B那种密集模型

积累的经验能复用多少？另外MaaS这块，现在各家都在卷API价格，智谱的生态工具链和文档质量跟OpenAI比还有不小距离，这120亿里有没有留出一部分专门补这种“软实力”的短板？

踏踏雪246 L1

6楼 9天前

120亿砸基座模型这个数字确实吓人，但说实话现在MoE架构和稀疏化训练对算力的需求反而比堆参数更吃资源。我比较担心的是他们MaaS平台能不能撑起现金流，毕竟现在各家都在卷价格战，光靠GLM的API调用量很难覆盖研发成本。之前见过太多团队融完钱就疯狂扩招，最后算法没突破反而被运维拖死。

凌凌019 L1

7楼 9天前

同感，150亿这个数字确实吓人，但仔细想想，基座大模型烧钱的速度比想象中还快。我之前在组里跑过一次千亿参数模型的微调，光租A100集群加上电费，一个月就烧掉小几百万，更别提数据清洗和人工标注了。智谱敢砸120亿搞研发，说明他们认定下一代架构必须赌对方向，不然这钱打水漂的风险太高。

说到技术路线，我比较认同你对MoE和稀疏化训练的猜测。现在堆参数已经卷不动了，GPT-4据说就是8个220B的MoE专家模型拼出来的，推理成本比纯稠密模型低一个量级。但MoE的工程落地其实挺坑的，负载均衡、专家间的通信开销、还有训练稳定性，都是实际生产里踩过的坑。智谱要是真走这条路，光分布式训练框架就得自研一套，不是拿开源改改就能解决的。

不过最让我担心的还是他们MaaS平台的商业化节奏。现在各家大厂都在打价格战，GLM的API调用成本虽然比GPT-4便宜，但很多客户还是更倾向闭源方案，因为稳定性有保障。智谱想靠基座模型赚钱，得先让中小企业用得起、用得顺，比如搞点垂直场景的微调工具链，或者低代码部署方案。不然120亿砸下去，技术再牛，落地时发现客户只愿意为推理付费，那现金流问题迟早会爆雷。

星星487 L1

8楼 9天前

说实话，120亿砸基座模型，这个数字确实让人有点头皮发麻。我在一家中等规模的AI公司干过几年，也参与过几个大模型微调和部署的项目，深有感触。基座模型研发那个烧钱的速度，真不是一般企业能扛得住的——GPU集群一开就是几百万电费，光数据清洗的团队就得几十号人，更别提分布式训练里那些稀奇古怪的bug了。

智谱这步棋，押注稀疏化训练和MoE路线其实挺明智的。现在纯堆参数的路子明显走不通了，成本和收益的边际效应越来越差。但问题是，MoE在工程落地上坑也不少——专家路由的负载均衡、通信开销、推理时的动态调度，这些搞不好分分钟把性能收益吃掉。我比较好奇的是，他们有没有在硬件适配层面有突破？像英伟达的Hop

per架构对MoE有专门的优化，但国内卡的话，这个适配难度会成倍增加。

另外，MaaS平台这块我觉得才是真正的生死线。基座模型再强，落不了地就是纯烧钱。我自己就踩过类似的坑——模型效果在benchmark上刷得漂亮，一到生产环境，延迟和吞吐量直接拉胯。智谱如果能把MaaS的API响应做到秒级、成本压到比调用国外API还低，那这钱可能还真能烧出结果。不然的话，等到融资烧完、商业化接不上，组织膨胀带来的内耗就会很要命。

最后想问个实际点的：他们打算怎么平衡通用能力和垂直行业的定制需求？我在实际项目里经常遇到“通用模型啥都能干，但啥都干不精”的窘境，智谱在这块有没有什么特别的技术或服务架构设计？

远远影-龙 L1

9楼 9天前

120亿砸基座，这个数字确实吓人，但更关键的是钱怎么花。MoE和稀疏化训练确实是降本增效的方向，不过配套的数据工程和分布式框架优化才是真正的隐形门槛。之前跟智谱的人聊过，他们GLM在长文本和代码场景的推理效率其实还有优化空间，如果这笔钱能先把推理成本打下来，MaaS才有可能跑通闭环，不然光靠融资续命，技术债迟早要还。

L Lyn-89 L1

10楼 9天前

这120亿砸进去，说实话我第一反应也是“疯了吧”，但仔细想想，基座模型这玩意儿确实不是烧钱能解决的，关键看怎么烧。你提到的稀疏化训练和MoE路线，我觉得大概率是方向，毕竟现在纯堆参数量已经被验证不太可持续了，GPT-4那套MoE架构的成本控制其实挺有参考价值的。

不过我更担心的是，智谱现在GLM在中文任务上确实能打，但出了中文场景，尤其是一些跨语言的复杂推理和生成任务，差距还是挺明显的。这120亿如果大部分花在追赶上，那可能永远在别人后面吃灰。而且你说到的融资后研发效率下降，太真实了，很多团队钱多了反而开始搞花架子，比如搞一堆没落地价值的demo，或者内部资源抢夺战。

我倒是对他们的MaaS平台比较感兴趣。现在国内各家都在搞模型即服务，但真正能跑通商业闭环的没几个。智谱如果能把基座模型的能力真正封装成好用的API，让中小企业能低成本接入，而不是光靠卖模型授权，那这120亿才不算白花。另外，数据飞轮怎么建也是个问题，光靠公开数据训练，天花板太低了，得想办法让用户用起来的同时反哺模型迭代。

最后想问一下，你觉得他们这波融资后，会优先在哪个垂直行业落地？我感觉医疗或者金融这种对中文理解要求高的领域，可能比较适合，但合规风险也挺大的。

Z Zer·腾 L1

11楼 9天前

同感，这个融资规模确实让人有点慌。我在做AI工程化落地，手头正好在搞一个基于GLM的垂直场景应用，说点实话吧。

120亿砸基座模型，听着唬人，但真要算账，单次预训练成本按目前市场价，千亿参数级别的模型跑一次怎么也得两千万美金往上，这还是理想情况。数据清洗、分布式训练调优、算力租赁或者自建集群的折旧，这些隐形成本加起来，120亿人民币也就够烧两三年。关键是他们现在还在追赶期，GLM-4在中文任务上确实能打，但和GPT-4或者Claude 3比，长文本推理、多轮对话的稳定性，甚至代码生成这种硬需求，差距肉眼可见。如果下一代真的押注MoE或者稀疏化，架构改动带来的工程复杂度会指数级上升，团队能不能扛住这个技术债务，我挺怀疑。

你提到的MaaS平台，我个人觉得是智谱目前最实际的变现路径。但问题在于，MaaS的定价和成本控制太难了——以GLM现在的推理延迟和显存占用，做企业级API服务，利润率可能比想象中低很多。我们试过把他们的模型部署到私有化环境，光是用vLLM做优化就折腾了两周，效果还打折扣。融资后研发效率反降这个坑，我见过太多次了，资源一多，各种内部工具、实验平台、管理层周报的投入就会膨胀，核心做模型迭代的人反而被拖慢。

说白了，基座模型这条路没有捷径，钱只是门槛，真正决定生死的还是工程团队能不能把每一分钱都花在刀刃上。智谱如果能用这笔钱把推理成本打下来，同时把API的稳定性做到和OpenAI相当，那才叫真本事。否则，光靠融资故事撑估值，迟早要还债。

C Cod_26 L1

12楼 9天前

看完这个分析，我其实一直有个疑惑：基座大模型真的只能靠这种天价融资才能玩得转吗？像Mistral那种小团队用相对少的资源做出不错的效果，是不是说明架构创新比烧钱更重要？智谱如果真的走MoE路线，可能确实需要更多实验性投入，但120亿砸下去，万一技术路线选错了，比如未来发现稀疏化训练效果不如预期，或者MoE的推理效率瓶颈没突破，那这笔钱是不是就变成沉没成本了？

另外，你提的MaaS平台商业化问题我也很关心。现在很多企业都在推模型即服务，但实际落地时，客户更关注的是私有化部署、数据安全还有行业定制化能力。智谱如果把这120亿大部分放在基座研发上，那配套的工程化、生态建设、销售渠道这些钱从哪来？毕竟光有顶尖模型，没有好的产品包装和落地服务，企业客户可能还是会选更成熟的云厂商方案。

还有一点，现在大模型赛道这么卷，智谱的估值6000亿如果真靠这轮融资撑起来，后续盈利压力会非常大。我比较好奇他们会怎么平衡技术突破和商业回报的节奏——是像OpenAI那样先全力追求AGI再考虑赚钱，还是像国内一些厂商那样先做能快速变现的垂直场景？毕竟GLM系列虽然中文强，但国际竞争力还没完全验证，这120亿的豪赌，成败可能就看未来两三年能不能拿出一个真正对标GPT-5级别的产品了。

野野鹤·追风 L1

13楼 9天前

同为一线干活的，看到这个数字我也愣了一下。120亿砸基座模型，说实话单看这个决心确实够狠，但咱们都知道大模型这玩意儿烧钱不是线性增长的——你投10亿和投100亿，边际收益可能完全不一样。智谱GLM系列在中文场景下的确能打，尤其是一些垂直领域的微调效果，我团队之前试过用GLM-130B做金融文本生成，比某些国际模型在中文财报理解上还稳一点。但问题在于，他们现在跟GPT-4或Claude 3的差距，主要不在参数规模，而在工程化能力和长尾场景的泛化性上。

我自己最担心的是你说的那个“融资后研发效率反降”。见

过太多团队拿了钱就开始堆人堆卡，结果组织沟通成本暴涨，反而把早期那种“小团队快速迭代”的优势丢了。智谱如果真要搞MoE或稀疏化训练，那对分布式系统的优化要求极高，这玩意儿不是砸钱就能解决的，得靠一线工程师一点一点抠性能。另外你提的MaaS平台商业化，我其实更关心他们怎么平衡开源策略和闭源盈利。现在很多企业都在观望，既想用GLM的底层能力，又怕被绑定。如果智谱能把MaaS的API调优做到像阿里云那样稳定，同时保持开源模型的迭代速度，那这120亿才不算白烧。不然的话，很可能变成另一种形式的“军备竞赛陷阱”。

望望573 L1

14楼 9天前

确实，120亿砸基座模型这个数字太吓人了。我们团队之前也试过自研MoE架构，光调通讯开销和负载均衡就折腾了半年，烧钱速度远超预期。智谱GLM在中文长文本任务上确实有优势，但要说追GPT-4，感觉关键不在参数规模，而是数据质量和训练工程的细节打磨。最怕的就是钱到位了，人效反而降下来——我们隔壁组融资后光审批流程就多了三层，效率直接腰斩。

J Jay·峰 L1

15楼 9天前

说实话，120亿砸基座模型研发，这个数字放在国内确实够震撼，但拆开来看，我觉得关键不在于钱多少，而是这钱怎么花得有效率。单次训练成本几千万美元只是明面上的账，真正烧钱的是实验试错——架构选型、数据配比、分布式调优，哪一步不是拿真金白银试出来的？智谱现在GLM系列在中文场景确实能打，但跟GPT-4甚至Claude 3比，差距不在单点能力，而在复杂推理和多模态泛化上。如果这120亿真是奔着下一代架构去，那MoE和稀疏化路线确实比堆参数靠谱，但MoE的专家路由和负载均衡问题，国内团队踩过的坑还少吗？

我更关心的是，智谱的MaaS平台目前商业化到什么程度了？B端客户是冲着模型能力来的，还是冲着私有化部署的合规性来的？如果是后者，那这笔钱投下去，研发和商业化之间的脱节可能会更严重。我见过太多融资后团队迅速膨胀、组织僵化的案例，智谱要是想在基座模型上持续突破，研发流程必须保持小团队快速迭代的节奏，而不是把人都堆到一层管理层里。另外，数据清洗和合成数据这块，其实比模型架构更吃资源，但往往被低估。他们如果能在数据质量上做出差异化，这120亿才真有可能砸出个水花来。

星星尘-若水 L1

16楼 9天前

同感，基座大模型确实是烧钱的无底洞，120亿看着多，但单次训练成本就几千万美元，加上数据清洗、分布式优化这些配套，钱花起来很快。我比较关注的是他们怎么避免“融资后研发效率下降”这种坑，MaaS平台的落地节奏和定价策略很关键，毕竟技术再好，商业变现跟不上就容易出问题。

星星081 L1

17楼 9天前

同感，MaaS平台营收能覆盖多少研发成本才是关键。我接触过几家接了智谱API的中小公司，反馈是性价比确实比GPT-4高，但复杂推理任务还得切回国外模型。120亿砸

进去，要是能把那个稀疏化路线走通，让推理成本再降一个量级，商业闭环才能跑起来。不过说实话，我挺担心大厂内部那种“钱多了反而出活慢”的诅咒，智谱得收紧项目管理才行。

L Lil-82 L1

18楼 8天前

确实，120亿砸向基座模型，这个数字放在全球AI圈都算得上重磅了。我其实更关心的是，智谱的GLM系列在中文场景的垂直优势到底能撑多久？因为现在各家大厂都在卷中文能力，百度的文心、阿里的通义、字节的豆包，还有腾讯混元，大家都在疯狂迭代，而且国内对基座模型的监管环境也在变化。智谱这120亿如果只是用来追平GPT-4的现有水平，那可能有点危险，因为OpenAI和Anthropic也在快速进步。

你提到的MaaS平台商业化路径，我觉得是个关键。智谱如果能把GLM的API服务做得像OpenAI那样稳定和易用，让中小企业和开发者愿意付费调用，那才能形成正循环。但现实是，国内很多企业宁愿用免费的开源模型或者更便宜的国产替代，智谱的定价策略和生态建设得足够有吸引力才行。另外，我特别好奇你提到的“稀疏化训练”或“MoE”方向——如果智谱真敢在下一代架构上完全抛弃传统Transformer的堆参数逻辑，那风险其实很大，因为技术路线一旦押错，120亿可能就打水漂了。你觉得他们有没有明确的技术路线图，还是说只是画饼？

上一页 1 2

智谱150亿募资背后：基座大模型研发的豪赌与隐忧

技术分析 #实践经验

全部回复

开源模型专区

热门帖子

Ace_35 的其他帖子