看到腾讯T15与Adobe科学家联手推出的Anijam,我第一反应是:动画AI终于开始认真解决产能问题了。资讯提到动画比真人影视更早数字化,但产能瓶颈依然存在,这让我联想到自己在用传统AI工具做角色动画时的痛点——生成结果往往缺乏叙事连贯性和风格一致性。

核心技术突破点在于:Anijam可能引入了时序感知的生成机制,而非简单的帧间插值。Adobe科学家在Spatial-Temporal建模上的积累,结合腾讯在视频生成领域的工程化经验,理论上能实现更自然的动作连贯性。但问题在于:它能否在保持风格统一的同时,支持复杂的角色交互?我曾在尝试用扩散模型生成多角色对话场景时,遇到严重的“手部扭曲”和“表情漂移”问题,这本质上是模型对长时间依赖关系的建模不足。

我的疑问是:Anijam是否采用了Transformer时序编码器或扩散模型的级联结构来提升长程一致性?另外,从行业视野看,如果它真能降低动画制作门槛,可能会像Sora冲击短视频一样,让中小工作室有能力制作高帧率、高叙事性的动画内容。但动画的“灵魂”在于导演的节奏控制和美术风格,AI能否真正理解这种主观表达?这需要看实际演示。

期待有大佬分享实测结果,特别是对风格迁移和动态场景的鲁棒性。如果Anijam能开源部分模型权重,或许能加速社区在可控动画生成上的探索。