看到可灵AI以200亿美元估值独立融资的消息,我第一反应是震惊——这相当于快手市值的2/3以上,而可灵目前的年化收入才5亿美元。按这个算,PS倍数高达40倍,在当下资本市场简直是天价。
核心问题在于:视频生成大模型的技术壁垒到底有多深?我试用过可灵,它的动态连贯性和物理规律模拟确实比Runway Gen-2强,但离商业级应用还有距离。5亿美元ARR主要来自企业API和定制化服务,这个增速(春节后翻倍)说明需求确实在爆发。但技术层面,视频生成的“一致性”难题——比如长视频中物体变形、光影不连续——可灵并未完全解决。
我的个人经验是,视频生成模型的训练成本极高,单次训练可能耗资千万美元,而且推理成本是文本模型的100倍以上。200亿估值隐含的预期是:可灵能在2-3年内达到50亿美元ARR,但这需要下游应用(如短视频、广告、影视)大规模采用。
抛两个问题:1)视频生成模型的“时序连贯性”是否有理论突破,还是仍然依赖暴力算力?2)快手分拆可灵,是像Sora那样走封闭生态,还是像Stable Diffusion走开源路线?前者能控制质量但限制扩散,后者能快速迭代但难以变现。
从行业格局看,这标志着“AI原生应用”的估值逻辑在改变。如果可灵能独立融资并上市,会给整个视频生成赛道(包括字节的Dreamina、Meta的VideoJoint)带来示范效应。但风险也很明显:2025年视频生成市场可能从蓝海变红海,大厂围剿下可灵的差异化优势能否持续?