乙巳新春,中国的推理大模型DeepSeek R1火爆全球。作为一款在推理能力上媲美OpenAI的o1且收费标准远低于o1的国产大模型,DeepSeek一时间在国内刮起一股扑面而来的全民AI风潮,并不令人意外,但这款来自大厂体系外创业团队的开源大模型,经由数位外国商界领袖与技术大佬口碑相传并最终形成在外国新闻媒体上“刷屏”的效果,则是非常耐人寻味了。
在笔者看来,DeepSeek火爆全球不仅仅是因为其在技术成熟度以及商业成本方面表现杰出,更重要的是DeepSeek是开源界一颗无比闪亮的新星,而美国1月份新出台的AI扩散框架新规,就像为DeepSeek闪亮登场打call一样。
通过分析为何DeepSeek的开源策略具有如此之大的“杀伤力”,我们可以看到中国企业必须要特别重视开源创新范式,避免简单地一提到“开源”就等同于“开源软件”,而是要以专业的战略性法律思维,探索开源创新范式在当前环境下对国内企业可能带来的战略价值。
01
DeepSeek火爆全球的背景回顾
DeepSeek-R1发布后7天内突破1亿用户,其用户增长速率远超ChatGPT同期表现,并在苹果应用商店登顶157个国家/地区下载榜。技术层面,R1以更低的成本取得了与o1同等水平的推理能力,同时开源推理系统代码,破解了行业闭源垄断的难题。全球科技巨头如微软、AWS、英伟达等迅速将其接入云平台,其也得到了微软CEO、谷歌前CEO、英伟达CEO等大佬的高度评价。
全球火爆之后,“麻烦”也接踵而来。以美国众议院“美中战略竞争特别委员会”主席约翰·莫莱纳尔(John Moolenaar)为代表的议员,指控DeepSeek“威胁美国国家安全”,主张扩大AI芯片出口限制,包括禁止英伟达特供中国市场的H20芯片,指责新加坡成为芯片转运中心。美国商务部着手调查DeepSeek采购的英伟达H800型号是否符合2023年10月生效的出口管制新规以及DeepSeek是否通过新加坡等第三方中转获取受限芯片。联邦调查局也正式启动调查其是否通过中间商获取被禁的英伟达高端AI芯片。美国总统特朗普公开表态称DeepSeek为美国AI产业敲响警钟,其发展对美国有益,但次日白宫就证实国家安全委员会已启动对DeepSeek关于数据流向和算法透明度的全面评估。另外,特朗普也召集英伟达CEO闭门会谈,据悉系讨论H20芯片更严格限制的相关议题。
除了技术先进性和商业成本方面的因素,为何来自中国的一款开源大语言模型在美西方引起如此轩然大波?——就在DeepSeek开源其推理模型R1并发布技术报告论文前的一周,BIS发布了“人工智能扩散出口管制框架”的临时最终规则和“实施先进计算集成电路额外尽职调查措施”的临时最终规则(“AI扩散框架”,具体介绍见
《铁幕将至?——美国AI出口管制新规详解》
)。该新规从AI训练算力和AI模型权重这一硬一软两个角度出发,设计了一套空前庞大的监管体系以限制AI能力向中国及其他对手国家扩散,也同时限制了其他国家(美国“盟友”国家除外)发展AI技术的潜力,其野心勃勃堪比三体人封锁地球科技。
但好巧不巧,开源偏偏是这套监管体系中最大的也或许是唯一的“漏勺”,更重要的是,这个“漏勺”原本是美国有意而为的,只不过DeepSeek的出现可以说是恰逢其时地打破了立法者的原有认知,也在一定程度上动摇了这套刚诞生不久的监管体系。
02
美国AI扩散框架新规有意“纵容”开源模型权重,但为什么?
众所周知,美国的阳谋是通过出口管制限制中国获取AI训练所需要的先进GPU算力和AI训练所得到的模型权重(model weight)的方式来遏制中国人工智能的技术发展。但是,BIS在本次新规中明确将开源模型权重排除在了管制范围之外。关于BIS这么做的理由,新规中有这样一段“自信满满”的论述:
“目前已知的开源模型,其训练规模没有超过1026的计算操作数(operations)。此外,美国商务部及其跨部门合作伙伴评估认为,目前最先进的开源模型比最先进的闭源模型能力更弱,部分原因是最先进的开源模型所使用的算力较少,以及专有(注:英文原文proprietary,在知识产权语境下其含义相当于私有闭源)算法的进步使得闭源模型开发者能够在相同的计算资源下开发出更先进的功能…相比之下,能够利用“闭源权重”模型能力的主体包括原始开发者、与原始开发者或部署者直接协商的主体以及窃取了权重的恶意主体。实际上,根据BIS的评估,最先进的闭源权重模型大多被其开发者严格掌控。”
基于上述理由,美国政府认为就现阶段而言,“纵容”开源模型所能实现的经济与社会利益超过了其可能造成的威胁,进而将其权重排除在了本次新规的管控范围之外。
开源的核心特征是源码向社会公众开放,虽然从常理出发来看,拥有最先进技术成果的企业往往会优先选择将技术用于商业化,而不是免费开放给公众做“公益”,但这充其量是一种基于当下世俗价值的经验判断,并没有其他依据可以证明开源技术就必然落后于闭源技术。事实上,从TensorFlow、PyTorch到Linux、Docker等,人工智能乃至计算机技术本身的发展就是建立在一个又一个里程碑式的开源项目之上。且在开发者圈子之中,开源精神与商业模式也已经出现了许多良性互动的迹象。
DeepSeek V3与R1开源模型恰如其分的出现时机,则是用板上钉钉的事实给了美国政府乃至全球企业界当头一棒,将AI扩散框架新规中“开源必落后于闭源”的预设碾得粉碎。
那下一个问题是,美国政府经过此次DeepSeek事件之后,是否会幡然醒悟加强对开源技术的出口管制监管呢?或许会,但就是这样简简单单一句话,想要在监管实操层面落地,其难度可能远超出人们的想象。
首先,美国出口管制监管体系将开源排除在外,并不是这次新规才出现的安排。EAR第734.7(a)条规定,“已发布的技术和软件”(published technology or software)一旦“可公开获得”(available to the public),即不属于EAR下的受控物项(除非涉及734.7(b)条所述的特定加密或武器相关软件/技术)。所谓“可公开获得”,包括以任何形式(不一定以出版形式,可以是互联网发布)向公众传播(不限制分发)。Linux基金会在其2021年的一份报告[1]中援引了这一条,表明来自Linux基金会以及与合作项目社区的开源软件均满足“已发布”的要求,故不属于受EAR管辖的“技术”或“软件”。
这一条款早已有之,即便本次新规不做专门说明,按照EAR既有规定也应当可以得到开源模型权重应当被排除在外的结论。归根结底,不是美国政府不想管,而是开源的核心特征就决定了开源技术在大部分情况下是无从管起,因为出口管制的基本对象仍然是物项(包括无形物意义上的软件、技术),其难以大规模地上升到以人的行为为基本对象,而开源技术在某种程度上可以视为是已经在全球范围内无限量存在的无形物项,即便其是美国人开发的、最早存储在美国的服务器上或是使用了原产自美国的工具。故想要封堵EAR中的开源“漏洞”,并非简单地移除EAR第734.7(a)条即可,而是需要将美国出口管制的底层逻辑做出重大调整,这将是一个体系性难题。
更重要的是,时至今日的开源文化已经不再是最初的理想主义情怀
DeepSeek事件「慢思考」——论开源创新的战略价值兼评美国AI扩散框架新规
AITNT
2025-03-11
5
0
本文由 Zyentor(智元界) 原创发布,转载请注明出处。
欢迎在 技术论坛 讨论本文相关内容