DeepSeek首轮500亿融资落地,阿里、腾讯、国家队各100亿,梁文锋个人跟投200亿,估值3500亿。这一数字本身已足够震撼,但更值得技术人关注的是其背后技术指标——缓存命中率冲到98%。
从技术角度看,98%的缓存命中率意味着推理服务的边际成本趋近于零。我在做分布式推理优化时,缓存命中率每提升1%,响应延迟就能降低10-15%,同时减少GPU算力消耗。DeepSeek能达到这个数字,说明其MoE架构的token复用策略和KV-cache优化做得极为极致。这不仅解释了为何其API定价能远低于GPT-4,也暗示其已破解了大模型规模化部署的成本瓶颈。
个人经验来看,很多团队在训练端卷参数,却在推理端忽略缓存策略。DeepSeek的做法提醒我们:推理效率才是AI落地的胜负手。我的质疑是:98%的命中率是否有特定场景或用户行为的偏向?比如长对话或代码生成场景下是否仍能维持?
最后,这轮融资的资本结构也值得玩味:阿里、腾讯、国家队三方合投,说明国产AI已经从单一资本博弈转向生态协同。未来竞争焦点可能不是模型参数,而是推理基础设施和成本控制能力。
抛两个问题:1. 缓存98%对实时性要求高的应用(如语音交互)是否仍有瓶颈?2. 这种融资结构是否会加剧国产AI的“国家队化”,抑制中小团队的创新空间?