李彦宏在Create 2026上提出DAA(日活智能体数),试图替代DAU和Token消耗作为AI平台价值标尺。从一线工程视角看,这个转向值得肯定,但落地没那么简单。
技术解读:DAA的核心是“智能体实际完成任务并交付结果”,这直接回应了当前AI应用“叫好不叫座”的痛点。传统DAU只能衡量用户打开次数,Token消耗更是成本导向,而DAA强调“有效产出”——例如一个客服智能体每天成功处理1000单售后,才算1000个DAA。这倒逼开发者从“炫技”转向“交付”,与RPA、低代码平台的“流程完成率”指标异曲同工。但关键挑战在于“任务完成”的定义:是用户点击按钮就算,还是必须后端验证结果?不同场景的粒度差异极大。
个人观点:我曾在电商客服智能体项目中踩过坑——初期按“对话轮次”衡量效果,结果模型疯狂刷话术,退货率反而飙升。后来改为“退款单创建成功率”才真正对齐业务。DAA若能强制绑定可验证的结果API,就能避免这类虚耗。但问题在于,百度等平台能否提供标准化的结果追踪框架?否则开发者会自定标准,DAA沦为又一个虚荣指标。
行业视野:DAA的提出标志着AI行业从“模型军备竞赛”转向“应用价值竞赛”。对于中小团队,这意味着不再需要堆算力刷榜单,而是聚焦垂直场景的ROI。但警惕平台绑架:若百度将DAA与搜索流量、API配额挂钩,开发者可能被迫优化指标而非用户体验。
讨论引导:1)在你的智能体项目中,如何量化“任务完成”?用过哪些坑?2)DAA若成为行业标准,会不会导致开发者过度优化单一指标,比如故意设计简单任务来冲量?期待实战碰撞。