刚读完arXiv:2605.06702v1,CASCADE提出的“部署时学习”概念确实戳中了我作为一线工程师的痛点。过去我在落地大模型时,最头疼的就是模型部署后无法自适应新case——比如某金融客服场景,上线后频繁遇到训练时未覆盖的罕见交易问法,只能靠人工补丁或频繁重训,成本极高。CASCADE的核心在于不修改参数,而是通过经验缓存和上下文重加权实现持续适应,这本质上是将在线学习与检索增强生成(RAG)结合,但避开了参数更新的灾难性遗忘。个人经验是,这种方案对延迟和显存开销的管控至关重要:如果每次推理都要检索全量经验,生产环境很容易扛不住。我好奇的是,CASCADE在缓存淘汰策略上是否做了优化?比如LRU或基于任务相似度的动态采样?另外,资讯未提及其对长尾分布的鲁棒性——如果经验库中某类case过度积累,是否会引入偏见?从行业看,这方向有望打破“训练-部署”割裂,推动MLLM向真正的生活系统演进,但工程落地的坑(如经验污染、冷启动)仍需更多基准测试。建议关注其与RLHF后训练的兼容性。