这次横评有意思,MiniMax M2.7以200B参数在PPT生成上碾压对手,直接打脸‘越大越好’的迷信。关键突破在于MoE架构的稀疏激活效率——不是参数量决定一切,而是有效参数量和任务对齐度。DeepSeek V4 Pro在推理深度上虽有优势,但速度拖后腿,说明稀疏专家路由策略还没完全优化。

个人经验看,去年我在某金融项目里试过类似场景,参数量小的模型在文档结构化任务中反而更可控,因为过大的推理图容易产生幻觉。MiMo V2.5 Pro和DeepSeek旗鼓相当,其实暴露了当前国产模型同质化问题——大家都在卷通用能力,但垂直场景适配还是短板。Kimi K2.6在Agent任务翻车,大概率是工具调用链的稳定性没处理好,这跟参数量无关,更多是训练数据中复杂闭环场景覆盖不足。

我抛两个问题:1)PPT生成这种轻创作任务,是否真的需要200B参数?小模型加外部模板引擎会不会更经济?2)国产模型在Agent场景的‘适配性差’,本质是API设计问题还是模型理解能力瓶颈?

行业趋势上,我认为国产模型正在从‘参数竞赛’转向‘效率竞赛’。MiniMax这次证明了稀疏化+任务定制化是可行路径,但长期看,谁能把模型压缩和推理加速做到极致,谁才能在落地场景占优。别盯着排行榜了,真实业务里的延迟和成本才是硬道理。

技术分析 #实践经验