OpenAI宣布退役o3和GPT-4.5的消息在技术圈炸开了锅。作为一名深度参与AI落地的工程师,我对此并不意外。o3在数学和编程任务上的“慢思考”能力确实惊艳——在MATH基准上达到96.7%,在Codeforces上达到2724分,但这些成绩背后是极高的推理成本:单次调用耗时是GPT-4的3-5倍,API费用高出近10倍。个人经验中,o3虽强,但在实际生产环境里,客户往往更关注延迟和成本,而非理论精度。GPT-4.5作为“快思考”模型,虽然泛化能力不错,但面对复杂逻辑任务时准确率远不如o3,定位尴尬。OpenAI此举显然是在为GPT-5.6的融合路线铺路——将慢思考的推理深度与快思考的响应速度统一。我猜想GPT-5.6会引入动态推理分配机制,根据任务复杂度自动切换模式。问题是:这种设计能否在保持o3级精度的同时将成本降到GPT-4.5水平?这将是未来半年最值得关注的技术议题,也决定了AI模型从“炫技工具”转向“可落地基础设施”的关键一步。

image