谷歌在昨夜举行了一场堪称“清仓式”的发布会,一口气推出了Gemini 3.5系列、Gemini Omni以及Spark智能体。这不仅是技术迭代,更是一次战略宣告——谷歌正在用自家产品亲手淘汰自己的旧时代,同时向OpenAI和Anthropic发起正面挑战。CEO桑达尔·皮查伊和DeepMind创始人德米斯·哈萨比斯亲自站台,足见这次发布的分量。
最引人注目的是Gemini 3.5 Flash模型。根据谷歌公布的数据,它在MMLU基准测试中得分达到89.6%,在数学推理、代码生成和多模态理解上全面超越GPT-4o和Claude 3.5 Sonnet。更关键的是,Flash的推理速度提升了40%,而API价格仅为每百万token 0.35美元,比GPT-4o便宜近60%。这意味着开发者可以用更低的成本获得更强的性能,对中小团队尤其友好。有测评者感叹,这是第一次真正感受到“断崖式领先”。
除了Flash,Gemini Omni的发布同样令人震撼。它支持文本、图像、音频、视频任意组合输入,直接生成连贯的视频内容。比如输入一段文字描述加一张参考图,就能输出一段带背景音效的动态视频。虽然目前生成时长限制在30秒内,但效果已经接近专业剪辑水平。此外,Spark智能体实现了7×24小时云端自动化,可以自动执行代码调试、数据分析和报告生成等重复性任务,相当于给每个开发者配备了一个永不休息的AI助手。
这次发布的时间点耐人寻味。就在上周,OpenAI刚推出GPT-4o的语音模式,Anthropic也发布了Claude 3.5的更新。谷歌选择在此时“一晚清仓”,显然是要用密集的产品矩阵压制对手。从行业影响来看,Gemini 3.5 Flash的性价比优势可能会倒逼其他厂商降价,而Omni和Spark则把AI应用的门槛进一步拉低。对于开发者来说,现在正是测试新模型、调整技术栈的最佳时机,尤其是Flash的兼容性已经覆盖了主流框架。未来半年,AI应用生态可能会迎来一次大洗牌。