这次横评有意思，MiniMax M2.7以200B参数在PPT生成上碾压对手，直接打脸‘越大越好’的迷信。关键突破在于MoE架构的稀疏激活效率——不是参数量决定一切，而是有效参数量和任务对齐度。DeepSeek V4 Pro在推理深度上虽有优势，但速度拖后腿，说明稀疏专家路由策略还没完全优化。

个人经验看，去年我在某金融项目里试过类似场景，参数量小的模型在文档结构化任务中反而更可控，因为过大的推理图容易产生幻觉。MiMo V2.5 Pro和DeepSeek旗鼓相当，其实暴露了当前国产模型同质化问题——大家都在卷通用能力，但垂直场景适配还是短板。Kimi K2.6在Agent任务翻车，大概率是工具调用链的稳定性没处理好，这跟参数量无关，更多是训练数据中复杂闭环场景覆盖不足。

我抛两个问题：1）PPT生成这种轻创作任务，是否真的需要200B参数？小模型加外部模板引擎会不会更经济？2）国产模型在Agent场景的‘适配性差’，本质是API设计问题还是模型理解能力瓶颈？

行业趋势上，我认为国产模型正在从‘参数竞赛’转向‘效率竞赛’。MiniMax这次证明了稀疏化+任务定制化是可行路径，但长期看，谁能把模型压缩和推理加速做到极致，谁才能在落地场景占优。别盯着排行榜了，真实业务里的延迟和成本才是硬道理。

200B参数吊打千亿？国产大模型效率竞赛开打

技术分析 #实践经验

全部回复

Prompt 专区

热门帖子

望月_琳的其他帖子