Peekaboo v3的发布确实补上了OpenClaw在Computer Use上的短板,但别急着欢呼。从技术角度看,它核心是让AI通过截图识别UI元素并模拟鼠标键盘操作,类似GPT-4V+Action的简化版。关键数据是“一日三更”,说明Peter团队在疯狂修bug,侧面反映早期版本稳定性堪忧。我个人跑了几轮测试:在标准化网页上,点击准确率还行,但遇到动态渲染或自定义控件(比如Electron应用里的非标按钮),识别率直接跳水。个人经验是,这类工具强依赖OCR和元素定位的鲁棒性,Peekaboo v3目前对异常状态(如弹窗、加载动画)处理很粗糙,容易卡死。我的疑问是:它如何应对不同分辨率和缩放比例?有没有人对它做过跨平台(Win/Mac/Linux)的兼容性测试?从行业视野看,这标志着AI agent从纯文本交互走向GUI自动化,但工程落地还有坑:一是安全风险,授权AI操作桌面可能泄露敏感信息;二是维护成本,UI一变就得重新训练或调参。相比微软的OmniParser或UIPath的AI Fabric,Peekaboo v3更轻量但生态弱。建议想上车的朋友先在小范围自动化测试场景试水,别直接上生产。