AI教父、图灵奖得主杨立昆近日再次语出惊人,直言“LLM就是一条死路”,并宣布离开Meta,带着10亿美元成立新公司AMI Labs,押注一条截然不同的技术路径。他的核心判断是:今天所有LLM都只是复读人类语言统计规律,从未真正理解物理世界,而生成式AI依赖的逐像素重建更是“坏主意”。这一立场不仅挑战了整个行业对Scaling Law的信仰,也引发了关于AI智能本质的深层讨论。

杨立昆与主流的分歧始于一段“不堪回首”的实验经历。在Transformer尚未问世时,他和团队尝试让AI逐像素预测视频下一帧,却发现无论怎么调参,生成的画面总是模糊发灰。原因在于,当未来有多种可能性时(如球可能向左或向右弹),模型被迫输出唯一确定的像素平均值,结果就是画面被冲淡。更致命的是计算复杂度:一张高清视频下一帧的可能性数量接近10的1500万次方,远超宇宙原子总数,根本无法像语言模型那样为每个输出设独立出口。这些实验让杨立昆坚信,像素重建不是自监督学习的正确方向。

为此,他提出了联合嵌入预测架构JEPA。与传统生成模型不同,JEPA不直接生成像素或文字,而是先将视频帧压缩成数学向量,在抽象的表示空间里预测物体的位置、速度和运动方向等真正可预测的信息。这一思路的核心是让AI先学会“表示世界”,忽略冗余细节,避免像素级生成的模糊和计算爆炸。杨立昆认为,这种能力才是通往“世界模型”的关键——一个能预判自身行为后果的系统,才能真正被称为智能体。而今天所有LLM,在他看来都不具备这种能力。

杨立昆的立场并非一时冲动。早在2015年,他就用“蛋糕图”预言自监督学习是智能的主体,当时业界沉迷强化学习无人相信,但10年后GPT为他平反。如今,当所有人追捧LLM时,他再次逆流而上,用10亿美元真金白银证明自己的判断。对于AI从业者而言,JEPA的提出意味着自监督学习可能迎来范式转换:从追求生成式的“像素级复现”转向结构化的“表示学习”。无论最终结果如何,这场关于AI根基的辩论,都将深刻影响下一代智能系统的设计方向。