{
title: "DeepSeek V4-Flash登顶全球调用榜,API价格再创新低",
summary: "DeepSeek V4-Flash在OpenRouter全球调用榜上连续两周位居第一,周调用量达5.74万亿Token,超过Anthropic和Google。同时,DeepSeek宣布V4-Pro API价格永久下调至原价的四分之一,每百万Tokens输入仅需2.5分钱,刷新全球最低纪录。此外,公司正推进700亿元融资,并组建Harness团队开发代码AI智能体产品,直指AGI目标。",
content: "流量不会说谎。在OpenRouter最新数据显示的全球AI大模型调用排行榜上,DeepSeek V4-Flash连续两周登顶,周调用量达到5.74万亿Token,超越Anthropic和Google。这背后是中国大模型调用量连续4周超过美国的趋势,5月18日至24日,中国AI大模型周调用量达9.22万亿Token,环比增长19.89%,而美国为4.93万亿Token。每一笔调用都是开发者用真实需求投出的信任票,生态粘性、数据飞轮与定价权正在悄然成形。
DeepSeek的价格策略再次引发行业震动。5月22日,官方宣布旗舰模型DeepSeek V4-Pro API价格永久下调至原价的四分之一,输入缓存命中仅需0.025元/百万Tokens,输入缓存未命中3元/百万Tokens,输出6元/百万Tokens。在第三方测算中,相同任务复杂度下,DeepSeek V4-Pro的平均调用成本约为GPT-5.5的十分之一,仅为Claude Opus 4.7的十一分之一。这一降价并非短期促销,而是基于新一代模型架构带来的推理效率提升和成本定价策略。正如创始人梁文锋所言,API和AI都应该是普惠的、人人用得起的东西。
除了价格优势,DeepSeek正在加速融资布局。据彭博社报道,公司正推进一轮规模高达700亿元人民币(约100亿美元)的融资,国家集成电路产业投资基金拟出资约100亿元,腾讯控股、IDG Capital等机构也接近参与,梁文锋本人或将投入最高约200亿元。充足的资金将用于突破性AI研究,直指通用人工智能目标。近期,DeepSeek宣布组建Harness团队,方向为代码AI智能体产品,核心公式是Model加Harness等于Agent,旨在将模型能力从生成升级为可执行任务。该团队正在北京招聘产品经理、工程研发等人才,目标是对标Anthropic Claude Code的桌面端编程Agent产品。
从价格红线到性能标尺,再到算力边界,DeepSeek正在改写大模型行业的生存游戏规则。对于AI从业者和开发者而言,当前是拥抱低成本、高频调用场景的最佳时机。DeepSeek的路径表明,当模型能力与基础设施成本同步优化时,AI应用的规模化落地将不再是梦想。未来,随着Harness团队的产品落地和融资到位,DeepSeek可能在Agent赛道掀起新的波澜,值得持续关注。"
}