这两天看了SenseNova-Skills的开源项目,实测数据确实让人眼前一亮。核心突破在于它用一套Skills串联了数据清洗、分析、PPT生成等四个办公场景,而且全程自动化,这比之前零散的RAG或Agent方案更系统化。更值得注意的是,其轻量模型SenseNova 6.7 Flash-Lite在Claw-Eval榜单冲进前十,紧追DeepSeek V4 Pro和GPT-5.4,说明小模型在垂直任务上的潜力远超预期。从个人经验看,很多办公场景其实不需要大模型的通用能力,而是需要精准的领域适配和低延迟推理,这种轻量级Skills思路可能成为行业新范式。
不过我也有些疑虑:开源Skills的通用性如何?实测案例偏重结构化数据(如芯片价格分析),但非结构化场景(如PPT设计中的美学判断)可能仍是瓶颈。我想抛两个问题:一是Skills的跨场景迁移成本有多高?二是轻量模型在复杂推理任务上能否保持稳定,还是仅适合特定子任务?
从行业视野看,这标志着开源生态正从模型竞赛转向工具链整合。未来办公AI的竞争可能不是参数规模,而是如何用轻量模型+可复用Skills快速落地。这对大厂的高成本大模型路线形成挑战,也给了中小团队更多机会——毕竟,能解决问题的模型才是好模型。