{
"title": "谷歌Gemini 3.5 Pro难产,CEO承认AI编程落后",
"summary": "谷歌在AI竞赛中遭遇挑战,CEO皮查伊罕见承认在AI编程领域落后于竞争对手。即将发布的Gemini 3.5 Pro被曝存在“懒惰”问题,长文本和高复杂度任务表现不佳,但视觉和多模态能力有显著提升。测试反馈显示,模型在编程场景中消极怠工、代码重写激进,而Claude和ChatGPT表现更优。尽管内部使用量每周翻倍,75%新代码由AI生成,但员工对自研工具Jetski不满。成本上升、安全限制加严,留给谷歌的时间不多了。",
"content": "谷歌CEO桑达尔·皮查伊在5月的I/O开发者大会上罕见承认,公司在AI编程领域,尤其是处理复杂软件任务方面,已经落后于竞争对手。这一表态让业界哗然,因为谷歌一直被视为AI技术的领军者。皮查伊坦言,尽管内部使用量每周翻倍,75%的新代码由AI生成,但Gemini系列模型在编程体验上的短板依然明显。即将发布的Gemini 3.5 Pro被曝面临难产,测试反馈显示其表现可能不敌Claude和ChatGPT。

Gemini 3.5 Pro的“懒惰”问题成为最大硬伤。据爆料,模型在处理长文本和高复杂度任务时表现出消极怠工,回应毫无用处。此前,Gemini 3 Pro在AI编辑器中过于激进地自动重写代码,导致用户审阅时因提问而被覆盖,拒绝修改则会丢失全部生成代码。而Opus 4.6表现完美,只需一次项目上下文输入即可只读分析,全程尊重待处理状态。这种“偷懒”行为已成为谷歌必须攻克的头号顽疾。

不过,Gemini 3.5 Pro并非毫无亮点。相比于上一代,新模型在视觉能力、图像生成、SVG生成质量以及多模态理解方面展现了更强实力。爆料称,其上下文窗口可能达到2M,进一步巩固了谷歌在高级数学证明领域的领先地位。但伴随升级的是更严格的内容过滤机制和安全限制,以及更高的定价。相比之下,OpenAI和Anthropic不仅模型更优,发布速度还在加速,留给谷歌的时间不多了。

谷歌的困境折射出AI行业进入“边际效应递减”的深水区。靠堆砌参数和算力实现指数级跨越的黄金时代正在远去,取而代之的是昂贵的算力成本、越来越窄的安全红线,以及模型自身的物理极限妥协。对于AI从业者而言,这提醒我们关注模型在真实场景中的可靠性和实用性,而非仅追求参数规模。谷歌需要尽快解决编程体验问题,否则可能失去在AI下半场的竞争力。