硅基流动冲刺港股,表面看是AI基础设施的胜利,但仔细拆解招股书数据,我发现几个值得深挖的技术和商业问题。截至2026年4月,日均5785亿token吞吐量、服务1.3万企业客户,这数字确实亮眼,但2025年营收仅5533万元,意味着每万亿token收入不到1万元——这价格在推理市场上基本是“白菜价”。更扎心的是毛利率转负至-24%,亏损3.45亿,说明公有云服务(占比超50%)的算力成本完全没被定价覆盖,典型的“赔本赚吆喝”。

从我个人的工程实践来看,Token工厂模式的核心矛盾在于:GPU集群的利用率与延迟要求之间很难平衡。实测中,为了支撑低延迟推理(比如对话场景),必须预留大量冗余算力,导致平均利用率常低于40%。硅基流动的数据佐证了这一点——日均吞吐量虽高,但成本结构显示其固定成本摊销压力巨大。

更关键的是,企业客户对API的定价敏感度极高。很多客户只愿意为“调用量”付费,不愿意为“预留容量”买单,这迫使平台长期处于价格战状态。阿里、美团等产业方虽然入股,但它们的内部推理需求可能优先走自家云,硅基流动只能吃“剩饭”。

抛两个问题:1. 当token定价逼近硬件成本线时,纯推理服务商如何靠技术优化(如量化、稀疏化)实现正向毛利率?2. 是否必须绑定大模型厂商(如DeepSeek、智谱)才能获得独占流量,避免沦为“卖水人”?

行业趋势上,我认为Token工厂模式会倒逼GPU-as-a-Service生态整合,但短期看,除非硅基流动能自研推理芯片或拿到超低价算力(比如利用闲置H100),否则亏损窟窿很难填平。它更像是AI泡沫期的“基础设施试验品”,对技术选型和成本模型的启示远超其商业前景。