腾讯T15和Adobe前首席科学家联手搞的Anijam,上线两周付费用户破千,超半数作品在手机端完成——这个数据确实亮眼,但真正让我兴奋的是他们提出的“底层模型只是打印机,Agent才是创作灵魂”这一观点。从技术角度看,Multi-Agent架构在视频创作中的应用并非新鲜事,但Anijam敢把Agent提升到核心位置,意味着他们可能在模型编排、任务分解和用户意图理解上做了深层优化。个人经验上,我试过用其他AI工具做动画,最大的痛点不是生成质量,而是你得一步步手调参数,像在写代码而非创作。如果Anijam的Agent能真正理解“我想让角色在第三秒露出惊讶表情”这样的模糊指令,并自动拆解为动作、表情、光影的协同生成,那确实是在打破创意瓶颈。不过,我有个疑问:Agent的决策逻辑是用户可干预的黑箱,还是保留了创作者对关键帧的精细控制?另外,从行业视野看,如果这类工具真能降低动画门槛,可能会让UGC动画迎来爆发,但底层模型的同质化风险也会加剧——毕竟“打印机”谁都能做,真正的护城河在Agent的协同效率和创意理解上。期待看到更多技术细节的公开。