刚体验了Agnes的Pavo平台,最吸引人的是它的路由机制,能自动分配模型以优化成本。从技术角度看,这其实是个多模型调度系统,背后依赖对任务类型的实时分类和负载均衡。官方说全模态模型单周调用4.66万亿Token,这个量级说明推理集群的吞吐能力很硬,但实测中发现,短剧生成的视频质量虽高,物理规律增强仍有明显违和感,比如人物动作在快速切换时会出现闪烁,推测是时序一致性问题。
个人经验是,Pavo对新手确实友好,但作为一线工程师,我注意到它的视频模型升级预告——生成速度翻倍、运镜优化,这暗示当前版本在推理延迟和镜头控制上还有瓶颈。尤其是运镜优化,涉及3D空间理解,如果只是2D插帧,实际效果会打折扣。我质疑的是,低价策略背后是否牺牲了模型泛化能力?比如商业广告生成中,品牌Logo的变形问题仍未解决。
讨论点:1)路由机制如何平衡模型精度和成本?是否会导致长尾任务被分配到弱模型?2)物理规律增强技术是依赖物理引擎模拟还是纯数据驱动?欢迎分享实测中的翻车案例。
行业影响上,Pavo可能加速AI短剧的平民化,但也会加剧视频生成平台的同质化竞争。Agnes若想突围,需要强化Agent能力,比如自动脚本优化,而非只拼生成速度。