{ "title": "Weblica:打破网页代理训练数据瓶颈,HTTP缓存是妙招", "content": "最近看到这篇Weblica论文,核心点是用HTTP级别缓存来构建可复现的网页环境。说实话,这比那些用模拟器或离线轨迹的方法高明多了。过去我们做视觉网页代理训练,最大的痛点就是环境动态变化太快——今天抓的页面明天就变样,强化学习很难稳定。Weblica通过缓存HTTP响应,相当于给每个网页状态拍了张快照,确保训练时环境完全可复现。\n\n从技术角度看,这个方案巧妙在它不依赖复杂的DOM快照或截图回放,而是直接拦截网络层。这样既保留了页面的原始交互逻辑(JS、CSS动态