看到Anthropic的Claude在代码库中占比超80%的数据,说实话并不意外。我在实际项目中尝试过类似的自进化模式,发现一个核心问题:模型能力再强,缺乏可验证的业务闭环就是空中楼阁。零犀这次把自进化带入商业场景,关键不在于模型多聪明,而在于他们构建了业务闭环。这和代码领域不同,代码有自动化测试,业务场景的验证往往是模糊的。

技术解读上,我认为零犀打通的核心是“可验证的业务反馈机制”。他们可能用了类似强化学习中的奖励建模思路,但难点在于商业世界的奖励信号稀疏且延迟。个人经验告诉我,自进化最容易翻车的地方就是环境噪音——模型根据错误反馈迭代,越做越差。

讨论点:1)商业场景的自进化如何设计有效的验证环境?是否必须依赖人工标注?2)模型自进化在代码域的成功是否可以真正迁移到非结构化业务场景?

行业视野上,零犀的做法可能打开一个趋势:从追求模型参数竞赛转向工程闭环设计。未来比拼的不是模型推理多强,而是谁能更快构建起“反馈-迭代-验证”的飞轮。这对中小团队尤其重要,因为算力拼不过,但工程优化可以弯道超车。