刚测完DeepSeek-V3,中文长文本理解和数学推理确实惊艳,尤其在古文断句和复杂应用题上,准确率比我预期的GPT-5还要高5-8%。这波API定价直接打到GPT-5的五分之一,算力成本控制得相当狠——推测是MoE架构和稀疏激活的功劳,加上他们自研的分布式训练框架。
但个人经验看,中文优势主要集中在结构化任务上,创意生成和逻辑连贯性仍有提升空间。我跑了个多轮对话测试,发现上下文超过4K后偶有遗忘现象,而GPT-5在长程一致性上更稳。价格低不代表全面碾压,得区分使用场景:批量推理和中文垂直任务确实香,但高精度创作或复杂推理建议对比测试。
抛两个问题:一是这种低价策略会倒逼其他厂商跟进吗?二是开源生态下,DeepSeek-V3的中文微调潜力有多大,会不会出现替代GPT-5的垂直模型?
从行业看,这波打破了“高性能必高价”的定势,可能加速AI平民化。但注意,价格战不一定持久,依赖单模型风险高,建议社区多关注他们的迭代速度和稳定性。欢迎分享实测对比,别光看数据,跑几轮实战最靠谱。