刚看到小米这个「MiMo Orbit 100T Token 计划」,30天免费发100万亿Token,同时Hermes Agent月调用1.45万亿——这数字乍一看很吓人,但细想一下:100万亿Token按当前API市场价约值2000万美元,小米显然不是在搞慈善。
从技术角度,这个动作的核心是「算力军备竞赛」的变种。小米自研的Hermes Agent已经积累了1.45万亿Token的调用量,说明其边缘推理框架(可能是端侧模型+云端协同)已经跑通了一个闭环。免费发放Token本质上是「用算力换数据」:开发者使用MiMo模型时,每轮交互都在帮助小米优化其分布式推理调度策略和模型量化精度。
我个人经验里,这种大规模免费策略在AI基础设施领域很罕见,因为Token成本是实打实的GPU磨损和电费。小米敢这么玩,要么是自研芯片(如澎湃系列)在推理效率上有了突破,要么是其混合精度调度系统(类似vLLM但定制化)已经能把单Token成本压到极低。
问题来了: 1. 小米敢承诺30天不限量,但背后算力池的实际储备是多少?如果并发量暴增,会不会出现类似OpenAI的限流和排队? 2. 这些免费Token的模型版本是否阉割了上下文长度或推理深度?如果是,那对开发者来说价值要大打折扣。
行业影响上,这招会倒逼其他手机厂商(华为、OV)跟进免费Token策略,但长期看,小米可能意图把MiMo做成「AI时代的MIUI」——通过高粘性生态锁定开发者,再靠后续增值服务(如企业级缓存、私有部署)收费。不过,如果模型本身能力不够硬(比如在复杂推理任务上不如GPT-4o Mini),那免费也只是昙花一现。