看到苹果、OpenAI和Meta纷纷押注AI吊坠,作为一线工程师,我第一反应是:这玩意儿之前失败的核心问题解决了吗?当年的AI Pin和Humane Air被吐槽最多的就是交互延迟、续航尿崩、以及大模型推理能力太弱导致语音助手像个智障。现在技术突破主要集中在端侧模型压缩和低功耗推理芯片上,比如高通骁龙8 Elite的NPU算力已经能跑7B参数模型,延迟从秒级降到百毫秒级。但个人经验告诉我,端侧模型的上下文理解能力依然有限,一旦涉及多轮对话或复杂任务,大概率还是要云端推理,那么网络依赖和隐私问题又会冒出来。我比较好奇的是:巨头们到底打算把多少推理放在本地?如果主打离线可用,那模型精度缩水后还能不能体现“AI”的价值?如果必须联网,那和手机语音助手有什么区别?另外,续航也是个硬伤,现有技术下,连续语音交互撑不过4小时,用户愿意每天摘下来充电吗?从行业格局看,AI吊坠如果真的铺开,可能会倒逼端侧芯片和模型蒸馏技术快速迭代,但短期内我更看好它作为手机的第二屏或特定场景配件,而不是颠覆性入口。大家觉得,这种脖挂形态的交互,真的能比手表或眼镜更自然吗?
AI吊坠复活?大模型加持下这波能成吗
全部回复
共 5 条同感,端侧跑7B看着美好,但实测上下文一长或者任务稍微复杂点,模型就开始胡言乱语,跟云端比差距还是明显。续航问题我觉得更现实,就算芯片功耗再
低,麦克风、蓝牙、屏幕这些外围器件一开,一天一充都够呛。要真想成,不如先把核心场景砍到极致,比如只做语音备忘和简单问答,别指望它当全能助手。
同感,你说的这几个坑我全踩过。去年我拿一块树莓派搭过一个实验性质的语音助手,接的是本地量化后的7B模型,结果就是你说的那个“智障”体验——稍微绕一点的指令,比如“帮我查一下明天下午三点到五点之间有没有空,顺便把之前的会议纪要翻出来”,直接死机,要么就是答非所问。端侧模型那点上下文窗口,真不够塞牙缝的。
续航这块我倒觉得今年有戏,骁龙8 Elite的能效比确实上来了,之前AI Pin那种必须挂个外置电池的搞笑设计应该能避免。但隐私问题我个人持保留态度。你想想,真要离线可用,模型得塞到多少参数?7B现在能在手机上跑,但那是用int4量化+剪枝换来的,实际推理效果你我都清楚,多轮对话里稍微一绕就崩塌。真要覆盖日常场景,要么云端兜底,要么用户忍受缩水体验。巨头们嘴上说隐私优先,但你看苹果搞的云端芯片方案,本质上不还是把数据传到服务器?只不过换了个“隐私计算”的马甲。
我比较关心的是交互形式。吊坠这东西,没有屏幕,没有触控反馈,全靠语音。一旦环境嘈杂或者用户口齿不清,体验直接归零。当年Humane Air被吐槽的另一个点就是收音差,我怀疑现在这些方案是不是真的在麦克风阵列和降噪算法上下了硬功夫。如果还是拿着手机上的语音助手体验硬往吊坠里搬,那这波复燃大概率又是资本讲故事。不如先解决“什么场景下用户必须用吊坠而不是掏手机”这个问题再说。
端侧跑7B模型确实进步很大,但我实测过几个方案,多轮对话稍微绕一点就露馅,上下文一长就开始胡扯。离线可用这个噱头听得多了,实际体验跟云端差距还是明显,真不觉得现在能绕过网络依赖,隐私问题也不是堆算力就能解决的。
端侧跑7B其实挺尴尬的,参数量砍到这份上,多轮对话稍微绕点圈子就掉链子,本地能做的无非是唤醒词和简单指令剪枝。真要离线可用,至少得把知识蒸馏和量化做到4bit以下,还得堆稀疏化推理,不然续航照样崩。巨头们要是还搞云端兜底,那隐私和网络依赖的老坑一个都填不上。
同感,端侧模型那个上下文窗口的问题确实是痛点。我最近刚好在玩一个7B的端侧模型做家居控制,单轮指令比如“关灯”基本秒回,但只要说“把客厅灯调到暖色然后帮我查下明天天气”,它就开始卡壳,要么只执行一半,要么直接报错。感觉模型在本地推理时,对意图拆解和状态跟踪的处理还是太弱了,更别提多轮对话了。
说到云端依赖,我反而觉得巨头们可能不会完全走离线路线。你看苹果那个专利,明显是搞混合架构——简单指令本地跑,复杂任务才传云端,而且用隐私计算做隔离。但问题在于,如果吊坠本身只是中转站,那电池续航的瓶颈就变成了无线传输功耗和待机策略。之前Humane Air那个5分钟烫手的问题,本质上就是本地算力不够,频繁唤醒云端导致发热。现在就算NPU强了,如果系统调度做不好,用户戴着它出门,动不动就要连手机热点或者等云端响应,体验还是拉胯。
另外,我比较担心的是产品形态的定位。吊坠不像手表有强刚需(看时间/运动监测),也不像耳机有封闭场景(通话/听歌)。如果只是语音助手+拍照,那和手机上的Siri/小爱有什么区别?除非它能做到真正无感交互,比如不靠按键唤醒,靠生物信号检测用户意图,但这技术成熟度还差得远。感觉这波更像是巨头们在抢占下一个可穿戴入口的试验田,成不成得看他们敢不敢砍掉手机联动,做独立生态。你觉着要是真搞纯离线,7B模型砍到1B以下,效果能忍吗?