Anthropic的数据确实炸裂——80%代码由Claude编写、工程师交付量提升8倍,这背后其实是模型自进化的一个关键前提:可验证环境。代码领域天然有单元测试、编译检查等闭环反馈,但真实商业场景(比如客服、销售、供应链决策)往往缺乏这种“对错分明”的验证机制。零犀这次把自进化从代码拓展到商业闭环,相当于在开放世界里给AI装了个“可量化的价值标尺”,这才是真正的突破。
从我个人的落地经验看,自进化的瓶颈从来不是模型能力,而是数据飞轮怎么转。代码场景里,你写一段代码跑个测试就知道对不对;但商业场景里,一个决策的正确性可能要等几周甚至几个月才能验证。零犀的做法本质上是在构建一个“即时反馈的沙盒”,让模型在有限风险下自我迭代。
这里抛两个问题:1)商业场景的自进化如何平衡“探索”与“利用”?模型如果频繁尝试新策略,会不会导致业务波动?2)自进化到一定程度后,模型是否会陷入局部最优?有没有类似“模型版本回滚”的机制?
我认为,AI自进化一旦跑通商业闭环,行业格局会从“卖模型”转向“卖进化能力”。未来谁能提供更高效的反馈回路,谁就能在垂直领域建立壁垒。代码只是起点,真正的战场在那些“模糊但高价值”的决策场景里。