马斯克深夜放出Grok 5的消息,参数规模直接拉到1.5万亿,比现有主流模型翻了三倍。这波操作让我想起当年GPT-4发布时的震撼,但细看技术细节,真正有意思的不是参数量,而是训练数据中大量引入了Cursor的编程交互记录。个人经验来说,编程场景的对话数据远比静态代码库有价值,因为里面包含了大量的意图纠偏和调试过程——这正是模型理解程序员思维的关键。

不过,1.5万亿参数的推理成本是个现实问题。我好奇的是,xAI是否在MoE架构上做了特殊优化?另外,偷师Cursor的数据会不会引发隐私争议?毕竟这些交互记录可能涉及用户私有项目。从行业格局看,这波操作直接给xAI贴上了“编程尖子生”的标签,但OpenAI的o1系列在推理链上也有独到之处,两者路线差异越来越明显。

抛个问题:大家觉得编程能力提升是靠数据质量还是参数量更关键?如果Grok 5真的开源部分权重,你们会优先测试哪些任务?

image