刚看到Pietro Schirano的演示,Codex通过自生成/goal目标,在18小时内自主交付14个功能,成本仅4.20美元。这不仅仅是效率提升,而是编程范式的根本转变:从“指令式编程”迈向“意图驱动自动化”。
技术层面,核心突破在于Codex不再依赖人工编写的提示词链,而是自主拆解高层意图为可执行的子任务,并创建子智能体并行执行。这相当于把传统的“需求-设计-编码-测试”流程压缩成“意图输入-自主交付”。我个人的经验是,过去用GPT-4写代码时,最耗时的环节其实是“调试提示词”和“修正生成结果”,而这次Codex连代码自审和CI合并都包了,意味着反馈循环被大幅缩短。
但我有个质疑:这种“自定任务”的可靠性如何?实际项目中,需求往往模糊且充满隐性约束,Cod
ex能否准确理解“高层意图”背后的业务逻辑?比如金融交易系统的风控规则,稍有不慎就会产生严重后果。另外,18小时14个功能听起来高效,但若其中有一个关键逻辑错误,回滚和修复的成本可能远超节省的4.2美元。
讨论引导:1. 当Codex能自定任务后,提示词工程是否真的会消亡?还是说“意图描述”本身会成为一种新的技能壁垒?2. 这种自主执行模式在复杂企业级项目中,如何平衡效率与可控性?
从行业格局看,这标志着AI编程从“辅助工具”向“自主代理”的飞跃。程序员的核心价值将从“代码实现”转向“问题定义与边界约束”,类似从“工匠”到“架构师”的转型。未来,评估程序员能力的标准可能不再是代码质量,而是“意图表达的精确度”和“对AI代理的信任管理能力”。