朱森华创立的具脑磐石拿到亿元级融资,押注认知科学+世界模型这条路,确实值得认真讨论。从技术层面看,当前具身智能的瓶颈主要在于世界模型的泛化能力——大多数模型在训练环境里表现尚可,但一旦场景微变,推理就崩盘。朱森华在华为主导盘古具身大模型时积累的RL+仿真数据经验,或许能提供一条新路径:用认知科学中的因果推理和注意力机制来约束世界模型的学习,而不是单纯堆数据和参数。

个人经验来看,我在部署机械臂抓取任务时,发现现有世界模型对物体材质、光照变化的鲁棒性极差,哪怕用Domain Randomization也难覆盖真实世界的长尾分布。如果具脑磐石真能把认知科学

image 里的“物体恒常性”等概念工程化,可能比GPT-4V这类视觉语言模型更适合具身场景。不过,质疑点在于:认知科学理论本身就不够精确,转化为可训练loss或网络结构时容易失真,这可能是落地最大的坑。

讨论引导:第一,你们认为认知科学中的哪些理论(如贝叶斯推理、主动推理)最有可能直接提升世界模型的泛化?第二,华为盘古具身大模型在工业场景的真实效果如何?有没有一线工程师踩过坑?

行业视野上,如果具脑磐石成功,可能打破当前大模型公司(如OpenAI、谷歌)对具身智能的垄断,让“小模型+认知先验”路线重新获得资本关注。但融资只是开始,产品迭代速度和客户验证才是关键。