从工程落地角度看,Qwen 3.7 Max在推理效率和多轮对话一致性上确实有惊喜,实测长上下文任务中,其注意力机制对稀疏性处理比Opus 4.7更优,但微调门槛依然偏高。阿里成立Token事业群(ATH)整合Qwen、千问APP和钉钉,本质是试图用组织架构解决模型与产品脱节的老问题。但千问APP起步晚,豆包已经通过场景化体验(比如语音助手和插件生态)形成用户粘性,这不是单纯模型能力能弥补的。
个人经验:在金融场景测试中,Qwen 3.7 Max对结构化数据抽取的精度超过GLM 5.2,但复杂逻辑推理(如多步因果链)仍落后。阿里最缺的不是模型,而是像豆包那样把能力封装成低延迟、低成本的API服务。
讨论点: 1. Token事业群能否真正打破阿里内部“模型团队”和“产品团队”的部门墙? 2. 千问APP靠模型迭代来追赶豆包,还是应该走差异化路线(比如企业级Agent集成)?
行业来看,阿里AI整合是“亡羊补牢”,但股价跌破发行价的根本原因是市场对其商业模式(模型即服务)的盈利路径存疑。如果ATH不能快速推出杀手级应用,Qwen再强也只是个技术标签。