在SpaceX冲刺IPO的当口,xAI内部却曝出一桩令人哭笑不得的乌龙:一名员工在数据迁移中手滑,导致编程产品核心训练数据被误删,相当于2到3周的工作量瞬间蒸发。The Information报道此消息后,记者Amir Efrati在X上调侃道,你最糟糕的工作日,可能也比这位xAI员工最糟糕的一天好上十倍。这起事故看似偶然,实则是xAI组织震荡留下的后遗症——自今年2月SpaceX完成收购后,11位联合创始人已全部离职,CFO辞职,算力与基础设施负责人出走,约10名Grok团队成员受到裁员影响。在一支不断换血的队伍里,一次迁移误删几乎是迟早的事。组织动荡的背后,是产品线始终未能追上竞品。xAI直到去年8月才推出第一款主打编程的模型,而Claude Code、Codex CLI早已在开发者中跑出口碑。马斯克自己也承认xAI在编程上落后,于是押注新一代基础模型V9(1.5T参数),计划通过注入大量Cursor的真实开发数据来补足短板。5月25日,他宣布V9-Medium训练完成,参数量约为V8-Small的三倍,针对英伟达Blackwell架构优化,预计2到3周上线。然而,被删掉的2到3周数据,正是V9训练的关键输入,让本就吃力的追赶雪上加霜。为了缩小差距,xAI还玩起了猫鼠游戏。据The Information报道,两名知情者透露,xAI曾进行持续数月的蒸馏项目,直接拿Claude的输出当训练材料喂给自家编程模型。这触犯了Anthropic的服务条款——禁止用其输出训练竞争模型。今年1月,xAI联合创始人Tony Wu告诉员工,Anthropic已切断公司访问通道;一些工程师改用个人账号继续使用Claude,结果账号被陆续封禁。xAI又转向加密中介Blackbox AI借道访问,直到5月中旬仍在通过该服务跑基准测试。马斯克本人对此并不避讳,今年5月作证时承认xAI部分用过OpenAI的模型训练Grok,称这在业内很常见。这场编程模型追赶战,说到底拼的是数据质量。马斯克将V8的短板归因于数据质量、全面性和比例不足,V9的翻身希望也在于更高质量、更贴近真实开发过程的数据。然而,xAI一边自研V9、注入Cursor数据,一边被曝采用有争议的蒸馏方法,甚至因手滑丢失宝贵训练数据。更戏剧性的是,SpaceX握有以600亿美元收购Cursor的选择权——追了几年没追上的编程能力,xAI最终把宝押在了一家比自己年轻得多的公司身上。而对于AI从业者而言,这起事故敲响警钟:在数据为王的时代,组织稳定性和数据管理流程,或许比模型架构本身更值得优先投入。毕竟,一次手滑就可能让数周努力付诸东流。