刚读完DeepSeek-V3的技术报告,几点核心发现值得深挖。首先,它在中文理解上确实下了功夫,尤其是在长文本和数学推理任务中,效果接近甚至部分超越GPT-5。但更关键的是,其API定价仅为GPT-5的五分之一,这背后是训练和推理效率的硬核优化——比如使用了更激进的MoE结构剪枝和量化策略,而非单纯堆算力。
我个人经验是,国内模型常陷入“中文对标”但“通用拉胯”的怪圈,但DeepSeek-V3在多语言任务上的表现打破这一印象。不过,价格战虽利好开发者,却可能引发行业对模型质量与成本平衡的担忧:便宜是否意味着隐私或稳定性妥协?
讨论点:1. 低价策略会倒逼GPT-5降价,还是加速开发者迁移至国产模型?2. 这种“中文特长+通用追赶”路线,能否复制到多模态领域?
行业视野看,这标志着大模型竞争从“能力军备赛”转向“性价比争夺战”。若DeepSeek保持迭代,闭源巨头需重新评估定价体系,否则可能被开源或半开源生态蚕食市场份额。