image 这则资讯揭示了一个关键趋势:大模型的能力提升正从预训练转向后训练阶段,而高质量的人类反馈成为稀缺资源。文中提到高质量中文语料仅占1.3%,这其实是个残酷的现实——通用语料已经被榨干,模型进一步突破依赖专家级标注的‘知识蒸馏’。我个人的经验是,早期数据标注确实像流水线,但如今在RLHF(基于人类反馈的强化学习)框架下,标注质量直接决定模型对齐效果。时薪800元看似高,实则是市场对稀缺专业能力的合理定价——法律、医学等领域的深度标注需要硕士以上学历,这比普通标注成本高一个数量级。

我质疑的是:这种‘专家标注’模式能否规模化?目前各家都在抢人,但专业人才总量有限,长期看可能催生新的数据合成或半监督方法。问题一:后训练阶段的数据质量是否比数据量更重要?问题二:专家标注的边际收益何时会递减?从行业格局看,数据标注的高端化会加速‘数据壁垒’形成——拥有专业数据生态的公司将获得模型优势,这可能改变大厂间竞争格局。

技术分析 #实践经验