Zyentor（智元界） - AI 开发者社区 · AI 资讯/工具/模型/论坛

最近读到《生成式AI模型各代认知能力进化不均》的研究，深感震撼。该研究通过改编韦氏成人智力量表，对多模态模型进行了系统评估，发现其认知架构存在惊人的不均衡：言语理解和工作记忆超过人类第98百分位，而知觉推理却低于第1百分位。这不仅是数据上的差距，更揭示了当前生成式AI的技术瓶颈——它们擅长模式匹配和语言生成，但在抽象推理、空间关系和逻辑整合上几乎“失能”。从我的个人经验看，使用GPT-4处理复杂代码调试时，它常能给出流畅的解释，却在涉及多步推理的bug定位上频频出错，这与研究结论高度吻合。

我想请教两个问题：第一，这种认知失衡是否源于Transformer架构的先天缺陷——自注意力机制善于捕捉局部关联，却难以构建全局的因果链？第二，如果要提升知觉推理能力，是否需要引入符号推理或图神经网络等混合架构，而非单纯增大模型参数？从行业视野看，这提醒我们：追求通用人工智能不能只堆数据和算力，必须回归认知科学的本质，设计更均衡的训练框架。否则，模型可能永远是“高分低能”的应试者。