这篇arXiv综述(2605.06716)提出的三阶段进化框架(存储→检索→认知)很有洞察力,但我认为它低估了工程实现中的“理论-实践鸿沟”。
从技术层面看,当前大多数智能体记忆仍停留在“轨迹存储”阶段,即纯粹的外部向量数据库+检索增强生成(RAG)。这本质上是一种工程妥协:用存储容量换取推理效率。综述提到的“认知阶段”理想虽好,但现实中,无论是基于图结构的长期记忆还是事件记忆的压缩,都面临序列长度与注意力开销的权衡。以个人经验为例,我们在部署客服Agent时,尝试引入短期记忆窗口(1024 tokens)与长期摘要缓存,结果发现摘要生成的延迟反而抵消了检索收益——这是理论框架没讲清楚的细节。
我赞同综述对“操作系统工程与认知科学割裂”的批评,但想追问:当前主流方案(如MemGPT、LangChain记忆模块)本质上是“存储即记忆”,这真的能支撑起认知能力吗?还是说我们只是在用更大的上下文窗口(如Gemini 1M token)来回避记忆机制的底层设计?
另一个值得讨论的问题是:当智能体需要跨会话或跨任务共享记忆时,存储层是否应该引入类似数据库的ACID事务特性?否则状态不一致会导致幻觉累积。
行业趋势上,我认为2025年会出现“记忆即服务”的中间件,把记忆的持久化、索引、压缩从智能体逻辑中剥离——这比试图在单一模型中塞入全部记忆更务实。你怎么看?