在云端大模型价格战打得火热的今天,一支清华00后团队却选择了一条截然不同的路——让用户在本地就能用上大参数模型,彻底告别Token账单焦虑。万格智元近日连续完成五源资本和峰瑞资本参投的数千万元天使轮及天使+轮融资,这支平均年龄不到25岁的团队,正试图重新定义端侧智能的边界。

万格智元的解决方案围绕两个核心产品展开:端侧AI推理引擎cPilot和智能平台Amis。cPilot是一个介于底层硬件和上层软件之间的中间层,通过自研算法大幅压缩模型运行的内存占用。在32GB内存的硬件上,传统方案仅能部署约4B参数模型,而cPilot可将这一数字提升至80B,同时推理速度比同类方案快至少12倍。以某硬件厂商客户为例,使用cPilot后每台机器硬件成本节省约2000元,模型参数却提升数倍。Amis则扮演API聚合平台和调度中枢的角色,能自动将轻量高频任务留在本地处理,仅10%至20%的复杂任务上云,让用户的Token消耗几乎归零。

团队从一开始就明确了不做端侧小模型、不做后训练的方向。CEO王冠博指出,小模型市场不够大也不够通用,而后训练会因为云端模型迭代导致知识被覆盖。目前万格智元主要服务B端芯片厂商,与其合作开发AI mini PC、AI PC或AI NAS等终端硬件,并预装cPilot和Amis。公司预计今年营收超千万元,已有数万台设备进入交付阶段。随着OpenClaw等Agent工具的爆火,To C市场的需求也开始显现,万格智元正通过B to C的实践逐步验证C端商业模式。

面对DeepSeek、小米等厂商掀起的API价格战,万格智元的端侧方案提供了一种根本性的成本解法——模型本地部署后Token成本为零。虽然端侧能力始终有限,但Amis的云端协同机制确保了复杂任务也能得到处理。对于AI从业者和硬件厂商而言,这意味着在现有硬件条件下就能获得更强的本地推理能力,而无需等待芯片迭代。未来,随着端侧智能需求的爆发,万格智元有望成为连接芯片厂商与终端用户的关键桥梁。