首个Gemini桌面端曝光，系统级Agent空降PC！

{
title: "谷歌Gemini桌面端曝光，系统级Agent空降PC",
summary: "谷歌I/O 2026前夕，首个Gemini桌面端曝光，带来四大核心功能：Gemini Spark系统级Agent、Stream to Cursor魔法指针、Gemini Omni全能生成模型和Gemini Live语音交互。同时，下一代旗舰模型Gemini 3.2 Flash编程能力惊人，不到1分钟可生成2000行代码。这标志着谷歌正从聊天机器人向操作系统级Agent跨越，有望颠覆人机交互模式。Mac版率先上线，Windows用户仍需等待。",
content: "谷歌I/O 2026大会今晚即将开幕，但预热活动已经让全网沸腾。CEO劈柴、Hassabis和Gemini产品负责人Logan接连在社交媒体上放出重磅消息，而首个Gemini桌面端的曝光，更是直接将期待值拉满。这不再是一个简单的聊天机器人升级，而是一次真正意义上的操作系统级Agent革命。

据知名爆料人TestingCatalog透露，Gemini桌面应用将迎来四大核心功能。首先是Gemini Spark，一个独立的Agent工作区，能够连接本地文件夹、读取代码文件、运行脚本、整理文件，甚至与Google Drive同步工作流。这意味着AI不再只是回答你的问题，而是能直接在你的电脑上干活，像Codex桌面版和Claude Code一样，但谷歌一步到位将其塞进了消费级产品。其次是Stream to Cursor，即此前在Android Show上惊艳亮相的魔法指针，现在被搬到桌面端。它让Gemini以浮动窗口形式实时感知鼠标所在窗口的上下文，光标悬停到哪里，AI就能理解并弹出操作建议，支持在Gemini 3 Flash和Gemini 3.1 Pro之间快速切换。第三是Gemini Omni，内部代号Veo4 Omni，暗示了与Veo 4的深度集成，将文字、图片、视频三大生成能力合并到一个统一模型中，这将是业界首个真正的全能生成模型。最后是Gemini Live，作为常驻语音悬浮窗出现在桌面端，目前仍在开发中。

除了桌面端，Gemini 3.2 Flash的编程能力也让人惊叹。开发者实测显示，一句提示就能在不到1分钟内生成2000行代码，搭建一个迷你版我的世界；另一个demo中，48秒内生成1700行代码并通过体素立方体测试。这种速度已经远超同类产品，让前端开发效率达到新高度。同时，办公全家桶也全面升级，Skills技能功能允许开发者将自定义脚本或功能文件夹直接挂载到Agent工作流中。

谷歌这次显然是在下一盘大棋。从聊天机器人到系统级Agent，从单一模态到全能生成，Gemini桌面端正在重新定义人机交互的边界。对于AI从业者和爱好者来说，这意味着我们即将迎来一个AI能真正理解并操控操作系统的时代。建议开发者们密切关注今晚的I/O大会，尤其是Gemini Spark和Stream to Cursor的开放时间，以及Windows版的适配进度。这可能是继ChatGPT之后，AI领域最值得期待的转折点之一。"
}

首个Gemini桌面端曝光，系统级Agent空降PC！

相关推荐

AI引爆漏洞洪灾，99%来不及修，安全人才告急

MiniMax M3：前沿 Coding 能力、1M 上下文、原生多模态，一个模型全给你

欧足联联手阿里云，AI重塑体育赛事新纪元

AI引爆漏洞洪灾，99%来不及修，安全人才告急

MiniMax M3：前沿 Coding 能力、1M 上下文、原生多模态，一个模型全给你