世界模型走了一些弯路

{
title: "世界模型概念被玩坏：从学术概念到营销噱头",
summary: "本文剖析了世界模型概念在AI行业中的异化过程，从杨立昆等学者的学术概念，到视频模型厂商借实时生成技术炒作，再到如猫薄荷（Catnip）等团队自创基准测试、自封第一的荒诞现象。文章指出，MaineCoon模型虽在视频生成速度上达到SOTA（8-9秒生成20秒视频），但画面质量堪忧，人物动作单一、背景模糊。行业呼吁回归技术本质，避免概念滥用。",
content: "世界模型，这个曾被杨立昆、李飞飞等学术大牛寄予厚望的概念，如今在AI行业里正经历一场令人啼笑皆非的异化。从最初试图超越大语言模型的学术探索，到如今被视频模型厂商当作营销噱头，世界模型已经走了一条弯弯曲曲的弯路。最近，一个名为猫薄荷（Catnip）的10人00后团队推出的缅因猫（MaineCoon）模型，更是将这种荒诞推向了新高度——他们不仅自称发明了“社交世界模型”，还自创基准测试SocialVideo Bench并自封第一，引发行业热议。\n\nMaineCoon的核心卖点是速度。其Instant Video功能号称“Fast & SOTA”，实测生成20秒视频只需8-9秒，确实在速度上做到了领先。但速度之外，视频质量却令人失望。以一段世界杯场景为例，输入提示词要求日本队队员射门、巴西守门员抱头痛哭、日本球迷跳舞庆祝，生成的画面却只会拍长镜头，人物动作单一，背景人物模糊到“量子化”程度，被网友戏称为“三体人提前打来”。作为视频模型，MaineCoon除了快，基本不具备实用价值。\n\n更令人困惑的是其流式视频生成功能。该功能分为Control Mode（导演模式）和Chat Mode（陪聊模式），用户可通过实时输入提示词改变画面。例如，让外卖小哥被车撞、被车主打、被警察逮捕，最后一起吃饺子——这种荒诞的场景切换，虽然展示了实时生成能力，但画面质量依然堪忧，人物动作僵硬，场景过渡生硬。这种“实时生成即世界模型”的逻辑，已成为行业通病。\n\n世界模型概念的异化，折射出AI行业浮躁的现状。从爱诗、快乐生蚝等公司借实时生成技术炒作，到猫薄荷自创基准测试自封第一，再到马卡龙（Macaron）为GLM 5.1后训练加5个Lora就声称自己领先，行业似乎陷入了“造词竞赛”。但技术终究要靠实力说话。对于AI从业者而言，与其追逐概念，不如回归基础研究，提升模型的实际能力。毕竟，用户要的不是一个会自封第一的模型，而是一个真正能解决问题、生成高质量内容的产品。世界模型的未来，需要更多脚踏实地，少一些“自导自演”。"
}

世界模型走了一些弯路

相关推荐

微信AI分身上线医疗场景，7×24小时秒回患者咨询

OpenMontage霸榜GitHub：开源视频剪辑新星

AI 能做一百件事，就做不了一个好看的 PPT

微信AI分身上线医疗场景，7×24小时秒回患者咨询

OpenMontage霸榜GitHub：开源视频剪辑新星

📖 更多原创