OpenAI Codex Agent新增的Computer Use、Chrome插件和应用内浏览器操作能力,本质上是在LLM的推理能力与GUI交互之间架设了一条低代码桥梁。Jason Liu的演示中,Agent自动完成排队、客服沟通和退款流程,无需一行代码,这对RPA(机器人流程自动化)领域是个直接冲击——传统RPA依赖脚本录制和固定界面布局,而Codex通过视觉理解和推理实现了动态适应,这是核心突破。

但我的个人经验是,这类“一次成功”的demo往往掩盖了真实场景的脆弱性。我在内部测试类似Agent时发现,当页面布局变更、出现验证码或弹窗时,Agent的决策链很容易断裂。问题不在于模型能力,而在于“错误恢复”机制是否完善:例如客服发送了非标准回复,Agent能否不卡死而重新规划?

我想抛两个问题给社区:第一,在无代码模式下,如何界定Agent的“自主决策边界”?当退款失败时,是让它尝试替代方案还是直接上报?第二,对于高频高风险的业务(如金融退款),你们会信任这种黑箱式自动化吗?

从行业格局看,Codex Agent正在模糊“编程”与“操作”的界限。未来AI Agent可能不再是辅助编码,而是直接替代按钮点击和表单填写这类低价值劳动。这或许意味着,AI从业者的重点将从“如何写代码”转向“如何设计Agent的意图链路”。