刚看到字节跳动的AI布局数据,确实让人震惊。TrendForce预测2026年字节服务器出货量达93.7万台,占中国市场的27.9%,这个数字背后是AI全栈技术从大模型到硬件的全面铺开。但更值得关注的是豆包大模型日均tokens调用量120万亿——这不仅是规模问题,而是推理效率与成本控制的直接体现。
我个人经验是,大模型部署的瓶颈往往不在模型本身,而在工程化落地。字节选择自建算力基建(火山引擎)而非单纯依赖云服务,显然是为了掌控推理延迟与数据主权。但问题来了:如此庞大的服务器集群,字节在分布式训练或推理时,如何解决跨节点通信瓶颈?比如NVLink或自家互联方案的取舍?
更让我好奇的是Seed校招覆盖具身智能——这是从虚拟到实体的跨越。具身智能需要实时感知与决策,算力需求与纯语言模型完全不同。字节是否在探索端侧推理芯片定制?毕竟93.7万台服务器若全用于云端,功耗与成本压力会非常夸张。
从行业看,字节这种‘基建+人才’双线押注,可能倒逼国内大厂跟进自建算力。但异构计算的兼容性(比如GPU与ASIC混用)仍是技术难题。大家觉得字节在AI for Science领域的硬件投入,会优先落地在生物计算还是材料模拟?期待讨论。