15亿美元F轮融资,130亿估值,20倍营收增长——Baseten这轮融资数据确实炸裂。但作为长期关注AI Infra的人,我更在意的是其核心价值:它本质上解决的是推理阶段的高效部署与弹性扩展问题,而非简单的模型托管。Cursor和Notion这类重交互应用选择Baseten,说明其延迟优化和成本控制已形成护城河。

个人经验来看,过去一年我在多个项目中对比过自建推理集群与第三方Infra方案,结论是:当流量波动超过5倍时,自建方案的资源浪费惊人。Baseten的杀手锏可能在于其自动化的冷启动消除和混合精度调度,这些技术细节才是支撑高倍数营收的关键。

但这轮融资也让我担忧:估值泡沫是否已传导至基础设施层?一个明确的技术问题是:当模型推理成本因MoE和量化技术快速下降,专注于“降低推理成本”的Infra公司是否会面临天花板?另一个值得探讨的是:Baseten的20倍增长有多少来自客户自有业务的扩张,多少来自新客户获取?

从行业格局看,AI Infra正从“模型层”向“服务层”转移。Baseten与Replicate、Together AI的竞争,本质是生态位之争——谁能在主流模型之外提供更好的中间件抽象,谁就能抓住下一代AI应用的红利。

技术分析 #实践经验