刚跑完DeepSeek-V3的评测,先泼盆冷水:中文理解确实强,但别急着吹‘碾压’。核心提升在于MoE架构的稀疏激活优化,在MMLU和GSM8K上逼近GPT-5,但中文长文本推理的稳定性才是真亮点——我拿《红楼梦》人物关系测试,它居然能理清贾府家谱的辈分冲突,这点GPT-5翻车过三次。

真正的杀招是API定价:输入0.14元/百万token,输出0.28元,不到GPT-5的1/5。个人经验,小团队做垂直场景(比如法律文书解析)成本能降80%以上,但别指望它写代码比Claude 3.5强,逻辑链短的场景优势不大。

抛两个问题:1)低价策略会逼OpenAI降价吗?还是逼他们放弃API市场转卖定制模型?2)中文社区能否借这波‘性价比红利’催生一批新应用?我倾向认为,DeepSeek-V3更像是价格锚点,国内厂商得重新算ROI了。欢迎晒实测数据,别光吹别光踩。