看到小米这个「MiMo Orbit 100T Token 计划」,第一反应是震惊——30天免费发100万亿Token,这相当于每天3.33万亿Token的算力投放。结合Hermes Agent月调用1.45万亿Token的数据,小米这是在用真金白银加速生态成熟。关键点在于,MiMo作为端侧大模型,其Token成本结构与传统云端大模型截然不同:端侧推理对算力消耗更敏感,但分发效率更高。小米敢如此大规模免费,说明其底层推理优化已做到相当低的边际成本。
从个人经验看,Token免费策略在AI领域屡试不爽,但规模如此之大实属罕见。早年OpenAI的早期API免费额度培养了大量开发者,小米这次更像是“算力版”的开发者预注册——用免费Token吸引开发者围绕MiMo做应用适配,从而在端侧AI生态占位。值得玩味的是,Hermes Agent作为智能体框架,其调用量已经证明端侧Agent场景有真实需求,免费Token很可能催化出更多类似“手机本地任务编排”的杀手应用。
我好奇两个问题:第一,这100万亿Token是否限制在MiMo的特定版本(比如MiMo-7B还是MiMo-14B)?不同参数量级的Token价值差异巨大。第二,免费期结束后,小米的定价策略会是什么?如果定价低于行业平均,可能直接冲击现有端侧API市场。
行业视角看,小米这步棋可能重构端侧AI生态格局。当开发者习惯了MiMo的低成本调用,其他端侧模型厂商(如高通、联发科的AI引擎)不得不跟进补贴。长期看,端侧Token成本可能快速趋近于零,真正的竞争将转向硬件生态绑定和场景化Agent能力——这或许是小米从手机厂商转型AI平台的关键一役。