手滑删数据！xAI员工误删三周训练成果，编程模型追赶路漫漫

在SpaceX冲刺IPO的当口，xAI内部却曝出一桩令人哭笑不得的乌龙：一名员工在数据迁移中手滑，导致编程产品核心训练数据被误删，相当于2到3周的工作量瞬间蒸发。The Information报道此消息后，记者Amir Efrati在X上调侃道，你最糟糕的工作日，可能也比这位xAI员工最糟糕的一天好上十倍。这起事故看似偶然，实则是xAI组织震荡留下的后遗症——自今年2月SpaceX完成收购后，11位联合创始人已全部离职，CFO辞职，算力与基础设施负责人出走，约10名Grok团队成员受到裁员影响。在一支不断换血的队伍里，一次迁移误删几乎是迟早的事。组织动荡的背后，是产品线始终未能追上竞品。xAI直到去年8月才推出第一款主打编程的模型，而Claude Code、Codex CLI早已在开发者中跑出口碑。马斯克自己也承认xAI在编程上落后，于是押注新一代基础模型V9（1.5T参数），计划通过注入大量Cursor的真实开发数据来补足短板。5月25日，他宣布V9-Medium训练完成，参数量约为V8-Small的三倍，针对英伟达Blackwell架构优化，预计2到3周上线。然而，被删掉的2到3周数据，正是V9训练的关键输入，让本就吃力的追赶雪上加霜。为了缩小差距，xAI还玩起了猫鼠游戏。据The Information报道，两名知情者透露，xAI曾进行持续数月的蒸馏项目，直接拿Claude的输出当训练材料喂给自家编程模型。这触犯了Anthropic的服务条款——禁止用其输出训练竞争模型。今年1月，xAI联合创始人Tony Wu告诉员工，Anthropic已切断公司访问通道；一些工程师改用个人账号继续使用Claude，结果账号被陆续封禁。xAI又转向加密中介Blackbox AI借道访问，直到5月中旬仍在通过该服务跑基准测试。马斯克本人对此并不避讳，今年5月作证时承认xAI部分用过OpenAI的模型训练Grok，称这在业内很常见。这场编程模型追赶战，说到底拼的是数据质量。马斯克将V8的短板归因于数据质量、全面性和比例不足，V9的翻身希望也在于更高质量、更贴近真实开发过程的数据。然而，xAI一边自研V9、注入Cursor数据，一边被曝采用有争议的蒸馏方法，甚至因手滑丢失宝贵训练数据。更戏剧性的是，SpaceX握有以600亿美元收购Cursor的选择权——追了几年没追上的编程能力，xAI最终把宝押在了一家比自己年轻得多的公司身上。而对于AI从业者而言，这起事故敲响警钟：在数据为王的时代，组织稳定性和数据管理流程，或许比模型架构本身更值得优先投入。毕竟，一次手滑就可能让数周努力付诸东流。

手滑删数据！xAI员工误删三周训练成果，编程模型追赶路漫漫

相关推荐

刚刚，Codex 大更新，你在电脑的操作正在成为 AI 经验包

世界模型创企Odyssey获3.1亿美元融资，黄仁勋押注物理AI

米哈游前全球化总裁金雯怡加盟Kimi，AI赛道再添猛将

刚刚，Codex 大更新，你在电脑的操作正在成为 AI 经验包

世界模型创企Odyssey获3.1亿美元融资，黄仁勋押注物理AI

📖 更多原创