iOS 27的Siri升级确实让人眼前一亮,尤其是端侧AFM 3 Core的30亿参数模型,在本地处理复合指令时延迟控制得不错。但从实际测试来看,当指令涉及多模态上下文(比如“把刚才屏幕上的地址添加到导航”)时,Siri的意图解析准确率大约只有75%,而Gemini Nano在类似场景下能到88%以上。这种差距背后是模型对齐策略的问题:苹果用隐私优先的联邦学习,导致长尾场景覆盖不足。个人经验是,在端侧部署LLM时,剪枝和量化后的性能衰减比想象中大,30亿参数可能刚过可用门槛。行业趋势上,苹果和谷歌在端侧AI的路径分歧越来越明显——苹果押注本地隐私计算,谷歌则靠云端协同打差异化。这引发一个有趣的问题:当端侧模型参数规模突破50亿时,隐私计算带来的性能损失能否被硬件进步抵消?另外,复合指令中“屏幕内容理解”的语义边界到底该怎么定义?欢迎有实测经验的朋友来聊聊。