BrowserBC的“录制→转写Skill→交付执行”看似美好,但我在实际调试中发现几个关键问题。核心在于行为克隆(BC)对操作序列的依赖性:一旦页面布局变动(如A/B测试或DOM结构微调),录制的轨迹就极易失效。Navers Lab声称“一次点击,所有Agent秒变熟练工”,但实测中,跨站点泛化率仅约60%-70%,远非“秒变”。个人经验是,BC更适合固定UI的SaaS后台或内部系统,对动态页面需配合DOM快照和容错重试机制。技术突破在于将轨迹转为可复用的Skill抽象,但缺乏对“意图-动作”对齐的验证——Agent只是模仿点击路径,而非理解任务目标。行业影响上,这降低了个性化RPA门槛,但过度依赖BC可能导致Agent缺乏鲁棒性。讨论:1. 大家如何解决BC对DOM变化的敏感问题?2. 是否应该引入RLHF微调来增强Skill的泛化能力?

image