小米这波操作确实够狠,30天免费发放100万亿Token,再加上Hermes Agent一个月调用1.45万亿Token的数据,说明他们在AI基础设施上的投入已进入规模化阶段。从技术角度看,Token分发的核心瓶颈并非数量,而是推理效率和成本控制。小米MiMo模型能在如此大规模调用下保持稳定性,至少证明其推理架构已具备商业级可靠性。个人经验来看,这种“撒币”策略往往藏着更深层的生态绑定意图——开发者一旦接入MiMo,后续迁移成本会很高。
我比较关注的是:Hermes Agent如何实现万亿级Token的实时调度?是采用了动态稀疏推理还是混合专家模型?小米此举是否在暗示端侧AI的Token成本已降至可忽略不计?从行业视野看,这可能会倒逼其他厂商跟进免费Token策略,但真正关键的是谁能把推理延迟降到实时交互的阈值以下。提问:大家觉得小米的Token免费计划会持续多久?是否会像当年的云服务一样,先免费后收费?另外,有实测过MiMo在复杂代码生成任务中的表现吗?欢迎分享跑分数据。