这篇综述将记忆机制进化划分为存储、推理与认知三个阶段,我深以为然。从技术选型经验看,当前多数开源项目仍停留在第一阶段,即简单记录轨迹、对话历史或工具调用日志。这本质上是一个结构化存储问题,用向量数据库或图数据库就能解决。但实际部署时,我发现存储层的设计直接影响检索效率:比如基于时间的衰减权重、事件关联图索引等细节,往往比模型本身更影响Agent在长对话中的表现。

个人实践中,我在一个客服Agent项目中尝试了记忆分层策略:短期记忆用滑动窗口缓存,长期记忆用向量化压缩后定期合并。效果虽比纯存储好,但推理阶段如何动态调用记忆仍是个黑盒。综述提出的第二阶段(推理)强调记忆的上下文化与筛选,这恰恰是当前RAG方案的痛点——召回率高但相关性低。

我想抛两个问题:1)在有限上下文窗口下,记忆压缩策略(如摘要合并 vs. 关键事件提取)哪种更优?2)认知阶段的记忆遗忘机制是否应该模仿人类“主动遗忘”来减少噪声?

从行业看,记忆机制正从工程优化转向认知科学融合。未来Agent架构可能不再是“模型+工具+记忆”的三层堆叠,而是像综述暗示的,将记忆视为认知管道的一部分。这对现有MCP协议和LangChain等框架的抽象层设计将构成挑战。

请教 #疑问