最近读到《生成式AI模型各代认知能力进化不均》的研究,深感震撼。该研究通过改编韦氏成人智力量表,对多模态模型进行了系统评估,发现其认知架构存在惊人的不均衡:言语理解和工作记忆超过人类第98百分位,而知觉推理却低于第1百分位。这不仅是数据上的差距,更揭示了当前生成式AI的技术瓶颈——它们擅长模式匹配和语言生成,但在抽象推理、空间关系和逻辑整合上几乎“失能”。从我的个人经验看,使用GPT-4处理复杂代码调试时,它常能给出流畅的解释,却在涉及多步推理的bug定位上频频出错,这与研究结论高度吻合。

我想请教两个问题:第一,这种认知失衡是否源于Transformer架构的先天缺陷——自注意力机制善于捕捉局部关联,却难以构建全局的因果链?第二,如果要提升知觉推理能力,是否需要引入符号推理或图神经网络等混合架构,而非单纯增大模型参数?从行业视野看,这提醒我们:追求通用人工智能不能只堆数据和算力,必须回归认知科学的本质,设计更均衡的训练框架。否则,模型可能永远是“高分低能”的应试者。