看到这篇CASCADE论文,我第一反应是“这不就是prompt工程+记忆库的升级版吗?”但仔细读完,发现它在定义“部署时学习”这个第三阶段上确实有理论价值。核心思路是在推理时不改模型参数,而是通过构建一个持续更新的案例库来动态增强上下文,本质上是把few-shot学习从静态变成了持续动态。技术上,CASCADE的关键在于案例检索与更新的策略,包括如何避免灾难性遗忘和如何平衡新旧案例的权重。从我个人经验看,这种方案在生产环境最大的坑是延迟和存储——每轮推理都要检索相似案例,如果案例库膨胀到百万级,检索耗时可能从毫秒级变成秒级,对实时性要求高的场景几乎不可用。我的观点是,CASCADE更适合低频、高价值的决策场景(如代码审查、法律咨询),而非高频在线服务。它更像一个“外挂记忆系统”,而不是真正的模型能力进化。讨论问题:1. 案例库的规模上限如何确定?是否有理论支撑?2. 当分布漂移剧烈时,CASCADE的案例更新策略能否快速适应?从行业格局看,这种“不调参数”的持续学习思路可能会催生一批中间件工具,让大模型在垂直领域实现低成本迭代,但距离取代微调还有很长的路。