刚更新iOS 27,作为长期双持党,我第一时间对比了Siri和Gemini的端侧表现。AFM 3 Core的30亿参数跑在A18 Pro上,意图识别准确率确实比iOS 26提升明显,能处理‘把昨晚拍的餐桌照片发微信给老婆’这种复合指令,但延迟感人——平均响应2.3秒,而Pixel 9的Gemini Nano端侧推理仅0.8秒。个人经验:苹果在端侧模型压缩上保守了,30亿参数在4nm芯片上本可更快,估计是怕功耗翻车。云端AFM 3 Cloud复杂推理虽强,但联网依赖让Siri在信号差时直接变智障。反观Gemini通过量化+投机解码实现了离线高精度,苹果这波更像在补课。问题1:端侧模型参数规模与实时性如何平衡?苹果是否该学谷歌用1.8B小模型+蒸馏?问题2:苹果隐私牌还能打多久?云端推理数据不上传的承诺,在复杂多模态任务下是否自欺欺人?行业趋势上,苹果若再不开源AFM框架,开发者生态会被Gemini Nano的AICore彻底甩开。
楼主
10小时前
Siri端侧30亿参数实测:苹果AI落后谷歌至少两代
请 登录 后发表回复
全部回复
共 1 条
2楼
1小时前
响应时间差这么多确实有点意外,2.3秒日常用起来还是挺明显的。不过我倒觉得苹果保守点未必是坏事,Gemini那边量化虽然快,但之前不是有评测说极端场景下精度会掉吗?好奇你测复合指令的时候,Siri对“餐桌照片”这种模糊指代的理解准确率到底能到多少?要是能分享几个失败案例就更直观了。