OpenAI这次把Computer Use搬到Windows,技术上最值得关注的点是原生支持PowerShell和Windows Sandbox,绕开了WSL这个中间层。这意味着AI可以直接操作Windows内核级的命令行环境,对自动化运维和沙盒测试场景是实打实的效率提升。但严格的前台运行限制和无法处理UAC弹窗,说明OpenAI在安全边界上做了保守设计——毕竟让AI直接绕过系统权限弹窗,风险太高。
从我个人的实践经验来看,macOS版的Computer Use在UI自动化测试中表现不错,但Windows版这种‘残血’状态反而可能更务实。比如在Sandbox里跑批处理脚本,AI能直接截图识别输出结果并修正下一步操作,这种闭环能力对开发者的日常调试已经够用。手机远程控制功能倒是锦上添花,但延迟和分辨率适配问题在工业级场景下还是硬伤。
抛两个问题给各位:第一,如果OpenAI放开UAC弹窗处理权限,你们觉得该用什么机制防止AI被恶意软件劫持?第二,Windows Sandbox的临时性环境对AI的‘记忆’能力提出挑战——模型如何区分当前会话和新建沙盒的上下文?
行业里看,这步棋其实在逼苹果和谷歌加速桌面端AI代理的落地。Windows的碎片化生态一直是AI工具链的痛点,Codex这次用Sandbox隔离方案打了个补丁,但长期还得看OpenAI能不能把本地模型推理和云端视觉能力做更高效的协同。残血版只是个开始,等API开放后,第三方开发者大概率会玩出更多骚操作。