刚刚，百度开源模型Unlimited OCR拿下全球第一！作者疑似DeepSeek出走大神

{
title: "百度开源Unlimited OCR登顶全球，3B参数小模型大胜",
summary: "百度最新开源的Unlimited OCR模型以3B总参数、仅500M激活参数，在OmniDocBench v1.5和v1.6基准测试中分别取得93.23%和93.92%的综合分数，刷新端到端OCR的SOTA纪录。这一成绩挑战了“大模型至上”的主流认知，引发业界对高效模型设计的重新思考。模型作者疑似前DeepSeek核心成员，更增添了技术社区的热议。",
content: "在AI模型参数规模屡创新高的今天，百度开源的一款OCR模型却用“小身板”证明了性能与效率可以兼得。最新发布的Unlimited OCR，总参数仅3B，实际推理时激活的参数量更是只有500M——放在大模型时代几乎是个零头。但就是这个小到离谱的模型，在OmniDocBench v1.5上拿下93.23%的综合分，v1.6更是达到93.92%，直接刷新了端到端SOTA。这一成绩让许多依赖数十亿甚至上百亿参数的模型黯然失色，也引发了业界对“大模型是否必要”的重新审视。

Unlimited OCR的成功并非偶然。它采用了混合专家架构（MoE）和动态稀疏激活策略，确保在推理时只调用最关键的子网络，从而在保持高精度的同时大幅降低计算开销。在OmniDocBench的测试中，该模型在文档版面分析、文字识别、表格解析等多个子任务上均表现出色，尤其是在复杂排版和低质量图像场景下，其鲁棒性远超同类竞品。值得注意的是，OmniDocBench v1.6版本新增了更多真实场景的样本，包括手写体、倾斜文本和光照不均的文档，Unlimited OCR依然能保持接近94%的准确率，显示出强大的泛化能力。

更令技术社区兴奋的是，模型作者疑似前DeepSeek的核心成员。DeepSeek团队此前以高效模型设计闻名，其成员出走后的动向一直是业界关注的焦点。如果这一猜测属实，那么Unlimited OCR的诞生不仅是一次技术突破，更可能预示着中国AI人才流动带来的新创新活力。百度此次选择将模型开源，也意在吸引更多开发者参与优化，推动OCR技术在金融、医疗、教育等领域的落地应用。目前，该模型已在GitHub和Hugging Face上开放下载，并提供了完整的推理脚本和微调指南。

对于AI从业者而言，Unlimited OCR的启示在于：在算力成本日益高昂的当下，“小而美”的模型或许才是务实之选。建议开发者在实际部署前，先评估自身场景的复杂度——如果主要处理标准文档，500M激活参数足以胜任；若涉及极端多样化的输入，则可通过微调进一步提升性能。未来，随着稀疏计算和模型压缩技术的成熟，我们有理由期待更多类似Unlimited OCR的“轻量级巨人”出现，让AI真正从实验室走向千行百业。"
}

刚刚，百度开源模型Unlimited OCR拿下全球第一！作者疑似DeepSeek出走大神

相关推荐

豆包App悄然上线打车，AI助手迈入出行服务

刚刚，阿里HappyHorse1.1上线，我用它把国足送进世界杯

豆包App悄然上线打车，AI助手迈入出行服务

刚刚，阿里HappyHorse1.1上线，我用它把国足送进世界杯

豆包App悄然上线打车，AI助手迈入出行服务

📖 更多原创