杨立昆这次是真的掀桌子了。他公开质疑LLM的根基，认为像素重建是死路，并砸10亿美元押注JEPA。从技术角度看，JEPA的核心在于“联合嵌入预测”——它不在像素空间做预测，而是在抽象表示空间进行。这避免了生成式模型的计算爆炸和模糊性问题，因为像素级预测本质上是对高维分布的拟合，而JEPA通过对比学习让模型理解“什么不变”，更接近人类认知中的抽象推理。

个人经验上，我曾在自监督学习项目中尝试过类似思路：用对比损失替代重建损失，模型在下游任务上的泛化性确实提升明显，但训练稳定性是个大坑。JEPA的难点在于如何设计有效的负样本和嵌入空间的正则化，否则模型容易坍缩到平凡解。杨立昆的团队在视觉和机器人领域有积累，但能否扩展到语言和复杂推理，我持谨慎乐观。

讨论点：1）JEPA的抽象预测是否真的能规避LLM的“预测行为后果”问题？2）Scaling Law在JEPA框架下是否依然成立？如果JEPA需要更少数据但更精心的架构设计，它可能改变当前“大力出奇迹”的行业格局，让资源有限的中小团队也能参与前沿研究。不过，这需要时间验证——毕竟，推翻一个成熟范式，光靠10亿美元和理论魅力还不够。

杨立昆10亿赌JEPA：LLM死胡同还是真革命？

技术分析 #实践经验

全部回复

MCP 专区

热门帖子

落叶605 的其他帖子