硅基流动冲刺港股,号称‘AI Token工厂第一股’,但招股书数据让我这个一线工程师看得直皱眉。2025年营收5533万元,同比暴增653.2%,看似亮眼,但亏损扩大到3.45亿元,毛利率竟为-24.0%。说白了,每卖一块钱Token,倒贴两毛四——这比早期云计算烧钱还狠。核心问题在于公有云服务占比超50%,GPU算力租赁和带宽成本压得喘不过气。Token吞吐量日均5785亿,但用户增长和收入增长不成比例,说明大量免费或低价流量在‘薅羊毛’。个人经验:去年我们团队试用过硅基流动的API,延迟和稳定性尚可,但定价策略混乱,企业客户很难按Token用量做成本预估。技术上看,他们强调‘推理引擎优化’,但没披露算力利用率和模型压缩比,这才是盈利关键。质疑:Token工厂模式本质是卖算力+推理服务,但GPU租赁价格波动大,加上DeepSeek等开源模型冲击,护城河在哪?讨论问题:1)毛利率转负,硅基流动是否该转向私有化部署或行业模型微调来提溢价?2)日均5785亿Token吞吐量,有多少来自高价值场景(如金融、医疗),而非低价值对话?行业视野:这波‘Token工厂’上市潮,让我想起2015年云计算公司流血上市,最终活下来的靠规模效应和生态绑定。硅基流动背靠阿里、美团,但能否熬过盈利拐点,取决于技术降本和客户黏性,而不是资本故事。
楼主
3小时前
Token工厂上市:营收暴涨亏损更猛,毛利率为负的AI生意怎么做?
请 登录 后发表回复
全部回复
共 2 条
2楼
3小时前
免费流量占比太高确实是硬伤,我们之前测过他们API,长文本推理的计费方式特别迷,按token数算但上下文窗口一开成本直接失控。这毛利率说明要么是拿补贴换市场,要么是底层调度效率还没跑通,但AI infra的规模效应真不一定能像云计算那么明显,毕竟GPU折旧和电力成本都是刚性的。感觉他们得先把企业级定价透明化做好,不然大客户根本不敢签长单。
3楼
3小时前
这数据看得我也直摇头。营收暴增6倍但毛利率-24%,说白了就是越卖越亏,典型的规模不经济。我们之前也试过硅基流动的API,说实话推理速度确实还行,但那个计费模型真的太迷了。按Token计价看似透明,但实际跑一次批量推理,成本完全算不清楚,有时候同样的请求量账单差两三倍,问客服也说不清是哪个环节的优化没做好。
你说的公有云占比超50%这个点很关键。现在各家大模型厂商都在拼API价格,硅基流动这种模式本质上就是帮客户垫付GPU租金和带宽,然后指望靠规模效应把成本摊薄。但问题是,现在算力价格战打到这个份上,英伟达的卡被云厂商卡脖子,中小模型公司根本拿不到议价权。我身边不少团队已经回流到用云厂商自带的模型服务了,至少成本可控。
另外那个日均5785亿Token吞吐量,我怀疑大量都是低价甚至免费引流来的。比如他们之前搞过开发者免费额度,一堆人拿来做测试和薅羊毛,真正能付费的企业客户转化率可能很低。我比较好奇的是,他们招股书里有没有披露付费用户的客单价和留存率?如果连这个都遮遮掩掩,那这个“Token工厂”的概念就真的只是讲给投资人听的故事了。
话说回来,推理引擎优化那个方向我倒是觉得有戏。如果能把显存占用降下来,或者搞成混合精度推理的自动化方案,说不定能把毛利率翻正。但前提是得先挺过这轮烧钱周期,不然再好的技术也白搭。