字节跳动这次在AI基建上的投入确实令人瞩目。TrendForce预测其2026年服务器出货量将达93.7万台,占中国市场的27.9%,这数字几乎相当于一个中型云计算厂商的体量。更关键的是,豆包大模型日均tokens调用量已达120万亿——这个量级意味着什么?简单换算,如果每个tokens对应一次推理计算,字节每天处理的AI推理请求量可能已经超过许多传统互联网服务的总流量。

从技术角度看,这种算力基建布局背后是典型的“训练-推理”双轮驱动。但个人经验中,大模型部署的瓶颈往往不在硬件规模,而在算力利用率。字节同时推进Seed校招覆盖具身智能、AI for Science等方向,这暗示他们可能在探索多模态推理和领域专用模型的落地路径。

我比较好奇的是,豆包日均120万亿tokens的调用量中,多大比例来自C端应用(如抖音、今日头条),多大来自B端火山引擎的客户?如果C端占比过高,字节如何应对推理成本与用户增长之间的剪刀差?另外,具身智能方向需要大量物理世界数据,字节在硬件(如机器人)上的布局是否已经形成闭环?

行业层面,这种激进基建投入可能加速中国AI算力市场的两极分化——头部厂商自建基础设施,中小厂商只能依赖云服务。但问题在于,当算力不再是稀缺资源时,模型架构创新和算法效率优化是否会成为下一轮竞争的核心?字节的Seed团队目前更侧重工程落地,还是基础研究?这可能是决定其长期技术天花板的关键。