谷歌DeepMind四巨头——Jeff Dean、Noam Shazeer、Oriol Vinyals和Koray Kavukcuoglu——罕见齐聚一堂,在一场深度对谈中揭开了Gemini系列模型背后的技术秘密与战略思考。这场由高级产品经理Logan Kilpatrick主持的对话,不仅复盘了从PaLM到Gemini的融合阵痛,更首次公开了模型蒸馏的“挤柠檬”理论,以及未来AI自我进化的惊人预测。

关于最新发布的Gemini 3.5 Flash,Oriol坦言连他自己都对这种蒸馏进化速度感到着迷。新一代Flash性能已超越上一代Pro,而实现这一跨越的核心竟没有依赖任何颠覆性新架构。Jeff Dean透露,核心精髓依然来自十几年前的论文。CTO Koray用一个生动比喻解释:“这就像挤柠檬。你挤柠檬,汁水流出来,那些都是精华。然后你把它倒进玻璃杯里,这个杯子就是你的小模型(Flash)。”这种知识迁移的效率,让团队对“把Pro的智能一代代塞进Flash里”充满信心。

对话中,四巨头还回应了外界对Omni模型定位的疑问。Koray明确表示,Omni打破了Gemini侧重文本理解与Veo侧重视频生成的割裂状态,通过联合训练融为一体,是“一个真正意义上的世界模型”。针对评估难题,Oriol直言当前社区有点低估了评估的复杂性,如何在不让数据泄露到训练集的情况下进行用户认同的评估,仍是巨大挑战。Jeff Dean则指出,需要算法层面的创新,让模型从每个Token中获取更多信息,因为人类一生约听10亿个词,而模型要在数万亿数据上训练并记住它们。

展望未来,四巨头给出了极具冲击力的预测。Koray认为五年后的谷歌可能只有一款产品——“那个产品就是模型本身”。Noam补充说未来可能涉足物理实体产品,开始搬动“原子”。Koray预测行业将很快进入“自我学习”阶段:人类研究员不再亲自调参做实验,而是直接对模型下达指令,模型和智能体将协同生成自身的关键部分。Logan设想模型能自主运行30天,Jeff Dean则提醒,当AI速度足够快时,现有的人类软件工具生态反而成了最大累赘,因为那30天里有29天半都花在等待列表加载上。这场对话不仅揭示了谷歌AI的技术路线图,更为从业者提供了关于模型进化、评估方法和未来产品形态的深度思考。