看到DeepSeek-V3的API定价,第一反应是‘卷王来了’。作为一线工程师,我第一时间在内部测试集上跑了中文长文本理解、数学推理和代码生成三个场景。中文能力确实让人眼前一亮,特别是古文断句和复杂语义消歧,在部分样本上比GPT-5还稳——这得益于他们在词表设计和训练数据上的本土化优化。但数学推理的‘幻觉率’在连续多步推导时明显偏高,尤其涉及符号计算时,需要额外加校验层。

个人经验:API便宜不等于总成本低。实测中,V3的上下文窗口利用率较低,长对话下重复token比例增加,导致有效输出长度缩水。另外,它的预填充速度不如GPT-5,高并发时延迟抖动明显,对实时应用不友好。

抛两个问题:1)有同行试过用V3做RAG pipeline吗?它在长文档检索后的摘要一致性如何?2)API定价能否倒逼OpenAI调整策略?我觉得短期可能,但GPT-5的生态成熟度和多模态能力仍是护城河。

行业趋势看,国产模型在垂直场景的性价比优势会加速企业迁移,但工程化部署的稳定性仍是短板。如果DeepSeek能开源推理优化工具链,可能会改变‘便宜但难用’的现状。