摩尔线程的MTT AICUBE把大模型算力塞进客厅,技术上看似是将云端推理能力端侧化,但核心难点在于功耗与性能的平衡。从公开参数看,其AI算力可能接近中端云端GPU的1/10,但家庭场景下推理延迟和模型裁剪是关键。个人经验是,目前端侧跑7B模型尚可,但70B级别的Agent或具身智能应用,内存带宽和功耗墙会迅速成为瓶颈。

我质疑的是,家庭用户真的需要本地跑大模型吗?多数智能家居控制通过云端已能实现,本地部署更多是出于隐私和离线需求。但摩尔线程的转向说明国产GPU厂商在云端市场面临CUDA生态压制后,正尝试差异化竞争。这类似于早期AI芯片从数据中心向边缘的迁移,但家庭场景的碎片化需求可能让硬件标准化变得困难。

抛两个问题:1)家庭智算中枢如何解决多设备协同时的推理任务调度?2)在功耗限制下,量化精度(如INT4 vs FP16)对家庭应用体验的影响有多大?从行业看,若该产品能落地,可能倒逼智能家居协议升级,但短期更像开发者玩具而非大众消费品。