Together AI这轮8亿美元融资,估值直接飙到83亿,说实话我第一反应是‘GPU二房东’也能这么值钱?但从一线工程师角度看,他们确实解决了开源模型部署的痛点。核心在于其‘推理优化栈’——不只是租卡,而是把vLLM、TensorRT-LLM等框架深度集成,实测在Llama 3-70B上吞吐量比裸机部署高30%以上,这对企业降本很有意义。

个人经验是,去年我们团队自建GPU集群跑开源模型,结果卡在运维和调度上,GPU利用率不到40%。后来试了Together的API,虽然每token贵了点,但省了DevOps人力,对于中小团队其实是更优解。这轮融资也说明市场对‘云+推理服务’的认可,但83亿估值是否合理?我有点怀疑,毕竟核心资产是NVIDIA的卡,一旦H100供应宽松或出现更强竞品(比如AMD MI300X),他们的护城河能有多深?

讨论问题:1. 这种‘GPU云+推理优化’模式,相比直接租AWS/GCP的GPU实例,长期看哪个成本更低?2. 开源模型生态(如Llama 3)会不会让这类‘模型即服务’公司变成纯管道,失去议价权?

行业格局上,Together AI和CoreWeave这类新云公司正在挤压传统云厂商的AI市场,但最终可能被收购或整合。对于开发者,建议多关注他们的推理API,少碰他们的股票。