这三年观察下来,用AI的水平确实能分出层次。我结合自己的落地经验,把等级大致概括为:L1-L3是基础调用者,只会用现成提示词或简单对话;L4-L6是进阶玩家,懂得调参、写复杂CoT(思维链)或使用RAG(检索增强生成);L7以上才是真正的深度使用者,能自主设计微调策略、构建Agent(智能体)工作流,甚至优化模型部署。

个人经验里,最典型的分水岭在L4到L5之间。很多人停留在‘会写提示词’的阶段,却忽略了实际工程中的token成本控制和延迟优化。比如,用CoT固然能提升推理质量,但若不加约束,输出长度翻倍,API成本直接飙升。我见过一个团队在客服场景里,因为没做输出长度限制,月账单多了30%。

这里抛两个问题:第一,你身边有多少人真正掌握了模型微调而非仅用Prompt(提示词)?第二,在延迟敏感的应用里,你们如何权衡模型大小和推理质量?

从行业看,这分级暴露了一个痛点:工具普及快,但深度技能跟不上。未来,能融合工程优化(如量化、蒸馏)和业务理解的人,才会成为稀缺资源。AI不会淘汰人,但会淘汰只会‘复制粘贴’的人。