DeepSeek为何突然启动巨额融资?The Information的最新爆料揭开了谜底:创始人梁文锋在看到Anthropic Claude模型通过海量算力和数据训练出的惊人能力后,意识到如果不储备弹药,DeepSeek将无法在AI军备竞赛中生存下去。时间线也印证了这一点——Anthropic在今年4月发布Claude预览版,DeepSeek的融资传闻恰好也在4月中旬首次传出。这并非巧合,而是一次清醒的战略决策。

融资完成后,DeepSeek本周四罕见发布公开声明:所有部门人员至少翻倍,覆盖AI系统开发、基础设施、产品开发和深度学习研究。目前公司约300人,核心的Harness团队已进入每天面试状态。该团队负责人崔添翼今年3月从Jane Street跳槽加入,负责将模型转化为自主AI智能体。与此同时,DeepSeek正在加速适配华为芯片,梁文锋相信华为芯片几年内就能追上英伟达。但代价不小——工程师必须重写底层软件,导致DeepSeek长达15个月未发布新一代模型,错过了去年下半年的编程工具热潮。

在路演中,梁文锋对投资人直言:编程工具和AI聊天机器人都是AI进化中的临时产物,重注押在短期产品上会偏离通往AGI的终极目标。这次74亿美元融资中,梁文锋自己写了最大的一张支票——200亿人民币(约30亿美元),占总额的五分之二。融资完成后,DeepSeek设立了员工持股计划,按实际估值分配股份。梁文锋告诉身边人,他的战略不会变:继续开源、保持低价、专注AGI。他把AGI定义为机器在理解、推理、学习、规划和适应等广泛任务上达到人类水平。

梁文锋还强调,AI不应该被少数人控制。DeepSeek是目前唯一将所有模型底层代码完全公开的主要AI实验室。这一策略已在美国开发者群体中产生巨大影响:今年4月发布的旗舰模型V4,5月在Vercel的AI Gateway平台上token用量份额从不到1%飙升至17%,一个月内成为该平台第三大模型。轻量版V4 Flash的价格比Anthropic模型便宜20到50倍,且这种增长在6月仍在继续。对于AI从业者而言,DeepSeek的路径表明:在巨头争霸的时代,坚持开源和长期主义同样能赢得市场,但前提是必须有足够的算力储备和耐心。