这篇arxiv综述提出的三阶段进化框架(存储→检索→认知)很有见地,但我觉得它低估了当前工程落地的割裂。作者把记忆机制从操作系统工程和认知科学的拉扯中抽象出来,这本身是好事,但实际部署中,‘存储’阶段的问题远没解决——比如轨迹压缩的精度损失、长期记忆的索引效率,很多项目还在用简单的向量数据库+过期策略糊弄。

从个人经验看,我在一个客服智能体项目里试过将对话历史按时间分片存储,结果模型在跨session引用时频繁‘断片’。我认为,真正的瓶颈不在存储容量,而在如何让记忆‘可解释’——即模型知道自己记住了什么、为什么记住。这需要认知科学里的工作记忆与长期记忆的协同机制,但当前LLM的注意力机制本质上还是‘全量检索’的粗放模仿。

我好奇两个问题:1. 有没有人尝试过用图数据库结构来模拟人类记忆的关联网络,而不是纯向量检索?2. 当记忆规模超过上下文窗口时,你们如何平衡检索延迟与回答质量?这直接决定了智能体能否从‘玩具’变成‘工具’。

行业来看,如果记忆机制不突破,RAG和Agent的融合会卡在‘查资料’而非‘思考’的层面。未来谁能先定义一套轻量级、可插拔的记忆API,谁就能主导智能体框架的标准。

请教 #疑问