{
title: "世界模型概念被玩坏:从学术概念到营销噱头",
summary: "本文剖析了世界模型概念在AI行业中的异化过程,从杨立昆等学者的学术概念,到视频模型厂商借实时生成技术炒作,再到如猫薄荷(Catnip)等团队自创基准测试、自封第一的荒诞现象。文章指出,MaineCoon模型虽在视频生成速度上达到SOTA(8-9秒生成20秒视频),但画面质量堪忧,人物动作单一、背景模糊。行业呼吁回归技术本质,避免概念滥用。",
content: "世界模型,这个曾被杨立昆、李飞飞等学术大牛寄予厚望的概念,如今在AI行业里正经历一场令人啼笑皆非的异化。从最初试图超越大语言模型的学术探索,到如今被视频模型厂商当作营销噱头,世界模型已经走了一条弯弯曲曲的弯路。最近,一个名为猫薄荷(Catnip)的10人00后团队推出的缅因猫(MaineCoon)模型,更是将这种荒诞推向了新高度——他们不仅自称发明了“社交世界模型”,还自创基准测试SocialVideo Bench并自封第一,引发行业热议。\n\nMaineCoon的核心卖点是速度。其Instant Video功能号称“Fast & SOTA”,实测生成20秒视频只需8-9秒,确实在速度上做到了领先。但速度之外,视频质量却令人失望。以一段世界杯场景为例,输入提示词要求日本队队员射门、巴西守门员抱头痛哭、日本球迷跳舞庆祝,生成的画面却只会拍长镜头,人物动作单一,背景人物模糊到“量子化”程度,被网友戏称为“三体人提前打来”。作为视频模型,MaineCoon除了快,基本不具备实用价值。\n\n更令人困惑的是其流式视频生成功能。该功能分为Control Mode(导演模式)和Chat Mode(陪聊模式),用户可通过实时输入提示词改变画面。例如,让外卖小哥被车撞、被车主打、被警察逮捕,最后一起吃饺子——这种荒诞的场景切换,虽然展示了实时生成能力,但画面质量依然堪忧,人物动作僵硬,场景过渡生硬。这种“实时生成即世界模型”的逻辑,已成为行业通病。\n\n世界模型概念的异化,折射出AI行业浮躁的现状。从爱诗、快乐生蚝等公司借实时生成技术炒作,到猫薄荷自创基准测试自封第一,再到马卡龙(Macaron)为GLM 5.1后训练加5个Lora就声称自己领先,行业似乎陷入了“造词竞赛”。但技术终究要靠实力说话。对于AI从业者而言,与其追逐概念,不如回归基础研究,提升模型的实际能力。毕竟,用户要的不是一个会自封第一的模型,而是一个真正能解决问题、生成高质量内容的产品。世界模型的未来,需要更多脚踏实地,少一些“自导自演”。"
}
世界模型走了一些弯路
AITNT
3小时前
2
0