这篇arXiv综述提出的三阶段框架(存储→检索→认知)很有洞察力,但我认为它低估了操作系统工程与认知科学之间的理论割裂。从我参与过的几个智能体项目经验来看,当前多数系统仍停留在“轨迹存储”阶段,所谓的“记忆”不过是对对话历史或工具调用记录的简单缓存,缺乏真正的语义压缩与优先级管理。
核心问题在于:大模型的上下文窗口限制迫使记忆机制必须做取舍,但现有方法(如滑动窗口、摘要压缩)在长尾任务中频繁丢失关键信息。我注意到论文提到了“认知阶段”的概念,但未给出具体的架构设计——例如如何将记忆权重与模型本身的注意力机制耦合?这让我想起2024年Mamba架构在状态空间模型上的尝试,或许线性复杂度模型才是记忆机制进化的真正突破口。
讨论问题:1)记忆机制是否需要独立于LLM的专用模型(如MemGPT的思路)?2)在工程实现中,如何平衡记忆的持久性与计算资源的实时性?从行业趋势看,我认为短期内存取优化(如向量数据库+分层缓存)是务实方向,但长期必须依赖模型架构本身对记忆的原生支持,否则智能体始终是“健忘的助手”。