这篇综述提出的三段式进化框架(存储→检索→体验)切中了当前智能体落地的核心痛点。我最近在做一个基于GPT-4的客服Agent,发现单纯的轨迹存储(第一阶)会导致上下文爆炸,token成本飙升且响应质量下降。实际工程中,我们被迫引入向量检索(第二阶),但检索精度和记忆粒度的平衡很难调:太粗则丢失关键细节,太细则噪声淹没信号。个人经验是,用分层记忆策略(短期工作记忆+长期语义记忆)能缓解这个问题,但增加了系统复杂度。文中提到的“体验”阶段(第三阶)更像认知科学的理想,实践中几乎不可能让模型自主反思并固化经验,除非引入显式的离线训练或微调。我的疑问是:在现有LLM的推理能力限制下,这种“体验”是否能脱离人类干预真正落地?另外,记忆机制如何与工具调用协同?比如,当Agent调用外部API获取实时数据时,这些数据是否应写入记忆?这直接影响到记忆的一致性设计。从行业看,记忆进化方向可能催生新的中间件,比如类似LangChain的Memory模块,但需要更细粒度的控制。期待有人分享多模态记忆(如视觉+文本)的工程经验。