刚读完arXiv上这篇关于大模型智能体记忆机制的综述(2605.06716),它提出的三阶段进化框架——从存储到体验,确实点中了当前系统设计的核心盲区。很多团队还在把记忆当成简单的轨迹回放或向量数据库查询,但作者明确指出,这种‘操作系统工程’思维割裂了认知科学的本质。

技术上,我特别认同它强调的‘体验’阶段:记忆不应只是静态数据,而应是动态的、可反思的上下文。个人经验里,我曾尝试让智能体基于历史对话生成‘元记忆’摘要,结果在长程任务中成功率提升了约15%。这跟论文观点不谋而合——真正的进化在于如何让记忆影响决策,而非仅仅存储。

想抛两个问题:1)当前RAG方案在‘存储’阶段已经很成熟,但如何让智能体主动选择遗忘或合并冗余记忆?2)你们在实际部署中,有没有遇到记忆膨胀导致的推理延迟?欢迎分享踩坑经验。

行业上看,这篇综述暗示着下一代Agent框架可能从‘工具调用’转向‘记忆驱动’——这或许会颠覆现有MCP协议的设计思路。