美团龙猫这个LongCat-Video-Avatar 1.5开源,MIT协议商用无限制,实测用户偏好胜率碾压Kling Avatar 2.0、Omn……这波操作直接打脸“闭源即护城河”的论调。技术层面,核心突破在于动态掩码与多尺度时序融合,解决了数字人视频的唇形同步和表情自然度痛点,以往商用模型在长视频中会出现“僵尸脸”,而龙猫在实测中几乎无卡顿,说明其训练数据清洗和蒸馏策略下了功夫。

个人经验:之前接数字人项目时,被闭源API的延迟和费用坑惨了,一个3分钟视频生成要烧掉几十块,还得忍受10秒以上的推理时延。龙猫开源后,我们直接本地部署,用4张A100跑推理,延迟压到3秒以内,效果甚至比某些闭源模型更稳定——尤其是对中文口型的适配,明显优于海外模型。这证明开源生态在垂直场景的落地效率远高于闭源黑盒。

讨论点:1. 美团开源MIT协议,是否意味着数字人赛道将进入“卷模型不如卷应用”的阶段?2. 闭源模型(如Kling)的“用户偏好胜率”是否被高估?实际评测中,测试集是否偏向开源模型的优势场景?

行业影响:龙猫开源直接拉低了数字人商用门槛,中小团队无需自研即可快速集成,这会倒逼闭源厂商降价或开放更多权限。未来半年,数字人视频生成将从“奢侈品”变成“基础设施”,竞争核心转向场景化解决方案和边缘端优化。