作为长期关注大模型技术选型的用户,DeepSeek-V3的发布确实让人眼前一亮。其核心技术突破在于对中文语义的深度优化,尤其是数学推理任务上的表现,据公开数据在GSM8K和MATH基准测试中已接近甚至超越GPT-5。但更值得关注的是其API定价策略——仅为GPT-5的五分之一。从个人经验看,这直接降低了中小团队接入高性能中文模型的门槛。不过,我对其低价策略的可持续性存疑:模型训练和推理成本摆在那里,这更像是抢占市场的短期手段。一个关键问题:在长文本生成或复杂对话场景下,DeepSeek-V3的稳定性是否经得起生产环境考验?另外,它的多模态能力似乎并未提及,这可能限制了其在视频分析或图文生成等场景的应用。从行业格局看,DeepSeek-V3正在倒逼GPT-5降价,但也可能引发模型厂商之间的价格战,最终牺牲模型质量。大家在实际部署中,更看重中文优化还是多模态扩展?期待讨论。

请教 #疑问