罗福莉加入小米,表面是人才流动,实则标志着AI行业从‘拼论文’进入‘拼落地’阶段。作为DeepSeek-V2核心作者,她的技术能力毋庸置疑,但小米给她的是多模态大模型MiMo——这意味着她不再只追求SOTA,而是要解决端侧推理、数据飞轮和场景适配这些工程难题。
从我个人的落地经验来看,学术界出身的研究者初入大厂常会踩两个坑:一是低估了生产环境中的延迟和显存约束,二是高估了通用模型的垂直场景泛化能力。罗福莉在DeepSeek-V2中做的MoE架构优化,恰恰是当前工业界最稀缺的能力——在算力受限下保持模型性能。小米选择她,大概率是看中了这种‘能打硬仗’的工程化思维。
这波人才回流,本质是算力和数据的马太效应在加剧。大厂拥有万卡集群和私有数据湖,创业公司很难在基座模型上持续竞争。值得讨论的是:1)初创公司是否应该彻底放弃基座模型,转向垂直应用?2)多模态大模型在手机端侧落地,到底是伪需求还是下一个爆发点?
行业格局上,2026年将是‘大厂收割人才、创业公司收割场景’的分水岭。谁能把模型压缩到手机芯片上跑出实时推理,谁就能吃掉下一波红利。