大模型时代的开源模式与治理机制变革
中国网/中国发展门户网讯 2022年,以美国OpenAI公司(以下简称“OpenAI”)推出GPT-3大模型为标志,人工智能(AI)技术的大模型时代宣告开启。大模型(亦称通用模型、预训练模型、基础模型)被认为是AI技术从弱人工智能转向强人工智能(亦称通用人工智能,AGI)的里程碑,是AI技术发展的最新前沿领域,是新质生产力发展的关键技术要素,有望适用于广泛的经济社会各领域任务。在此过程中,软件源代码、数据、算法、模型架构、参数权重、硬件算力、算力网、工具链、创新政策、治理策略等为各类开放资源,是新型开源创新公地。然而,对这一公地的建设和治理面临新的机遇、风险和挑战,也正引发人类经济社会各领域的生产力和生产关系革命。
大模型的出现和应用,推动开源创新公地的生产模式和治理需求发生变化,但学界对此尚未形成治理共识。开源创新模式是包括AI大模型在内的前沿信息技术的经典创新协作模式,其诞生于软件和信息技术的创新生态发展中,是通过开放媒介和资源共享来实现数字技术创新和产品生产的人类经济社会领域创新协作活动,20世纪80-90年代至今,开源创新模式已从计算机软件拓展延伸至开放数据、开放标准、开放存取、开源硬件、开源人工智能大模型等前沿数字技术的创新研发和商业转化中。但是,在大模型创新发展中,各界对开源什么、如何开源、何时开源、开源给谁等方面争议不断,新的开源组织模式、治理要素、治理环节和治理风险等尚未得到充分研究。
因此,本研究将回答2个问题: 大模型技术的兴起如何改变了此前的开源创新模式? 如何协调各方资源以适应上述生产力与生产关系的结构性变革,在大模型时代实现开源创新公地的有效治理?
大模型时代的开源创新模式:挑战与机遇
开源创新模式面临新挑战
20世纪80年代以来,科技生产力的发展体现为多轮次的信息技术革命,在不同的技术时代,开源创新模式出现过自由软件阶段、开源软件阶段、开放智能阶段3个主要阶段,分别有相应的开源创新公地治理逻辑。
自由软件阶段——开源公地治理的初始阶段。该阶段源于计算机软件技术引发的生产力革命,时代特征是个人电脑的普及、软件应用及其服务的兴起,它继承了科学知识生产中的创新公地理念,遵循科学生产的治理逻辑,突出成就是创设了以“技术社区”这类社会主体为主导建设的创新公地并提供开源软件产品的开源创新模式,但新兴的软件产业和商业软件的盈利模式侵蚀着自由软件的开源创新模式,给软件产业发展带来危机。
开源软件阶段——开源公地治理的第2阶段。该阶段源于互联网技术引发的生产力革命,时代特征是互联网普及、平台经济兴起,突出成就是实现了科学生产与商业逻辑的并行互惠,既推动了基于互联网软件创新公地的健康发展,也促进了互联网产业和平台经济的蓬勃发展,逐渐成为经典的开源创新模式。不过,在该阶段出现的新的治理问题是开源生态与闭源生态的分野成为商业竞争的武器,大公司的加入并主导开源项目、平台和社区可能带来对新兴开源技术项目的垄断。
开放智能阶段——开源公地治理的第3阶段。该阶段源于当下的人工智能时代的大模型开源创新实践,业界期望能延续互联网技术模式下开源创新模式的“技术社区+企业”合作的成功逻辑,为人工神经网络模型的训练和服务提供公共资源、资金支持和商业回报;但是当大模型出现之后,模型训练的算力、数据和能源成本居高不下,商业价值尚未兑现,因此出现了较为激烈的大模型开源创新模式与闭源生产模式的创新效率之争。出现上述情形的重要原因之一,是以OpenAI推出的GPT系列为典型代表,大模型的训练成本随着每一次迭代升级呈指数级增长,其从创新发现到产业化应用的盈利逻辑尚不明确,导致单一公司及其主要投资方作为商业公司难以承受相应的成本;在互联网技术发展中取得成功的开源社区与商业公司合作以提供创新公地、实现软件产品商业价值转化的开源创新模式,在大模型时代面临算力和能源过度消耗、数据获取成本递增和技术社区风险外溢的多元挑战。探究大模型技术给开源创新模式带来的具体变化及其治理需求具有时代性。
综上,在开放智能阶段,以大模型为代表的AI革命带来了技术的跨越式发展,这使得开源创新的生产组织过程更复杂,创新产出的属性更多维,开源创新过程中的治理对象不再仅是软件源代码,治理活动的参与主体也不再仅限于作为社会主体的开源社区和作为市场主体的商业公司。同时,大模型创新研发和落地应用中的开源创新活动,面向的是算力、数据、算法、训练过程、推理过程、开发工具、应用接口、服务模式等的全链条环境,它们分别应该如何被归类定性,它们中哪些属于公地,哪些属于私有物品、俱乐部物品、公共物品等,尚未被讨论和分析;大模型开源治理的治理对象大多数尚且位于进入市场流通与公共地点的交界处,伴随着技术进展和组织发展而不断变化,排他性和竞争性的归属相较于开源软件的源代码更具有动态性和模糊性,更难在静态条件下进行准确判别。
公地治理理论迎来新发展
公地治理理论是解释开源创新内在逻辑的经典理论框架(表1)。以诺贝尔经济学奖得主奥斯特罗姆(E. Ostrom)为代表的经济学家和管理学者将软件开源创新实践与人类既有经济物品的属性进行比较,发现开源软件的核心特点是允许任何人在接受开源许可证的条件下自由获取、修改或分发源代码,具有非排他性和竞争性创新公地资源属性。

软件的开源创新活动区别于当代大众熟悉基于传统私有产权制度的商业软件生产模式,研究者对如何认识开源软件、怎样治理开源创新公地的问题展开了系统研究。例如,研究发现开源软件的竞争性,来自在开源创新活动中,软件代码等的边际成本、大模型的训练成本等随着更多人的参与不断累积,与在高峰期有更多的汽车并入高速公路类似,第1个和第2个软件用户之间产生的边际创新成本可能是可以忽略不计或是无法察觉的,但最终第N个用户会影响到第N+1个用户访问该相同软件的能力;更进一步,开源创新活动中创新主体的研发成本、监管者的注意力、使用者的信心等,都是可能被耗尽的竞争性资源。在公地治理理论指导下,开源软件产品被解释为一种以源代码为资源承载方式、以开源许可证为核心治理机制的“公地资源”。
软件的开源治理以“社会-市场”合作的开源创新模式为主(表2),遵循如下基本公地资源治理规律:① 开源创新模式作为研发共同体和开源技术社群中的广泛社会主体参与创新活动的研发生产规律;② 开源创新模式作为市场主体应对技术发展路径不确定性挑战、保留创新活力的技术演化规律;③ 开源创新模式作为新入局公司挑战行业领先企业、行业领先企业优化创新产品的市场竞争规律。

开源治理机制需要新变革
然而,大模型所内生的逻辑不可解释性和外生的行为不确定性,正在引发大模型技术创新中的算力陷阱、数据瓶颈、算法不可解释性等危机,以及技术研发、市场应用、社会伦理与法律规制、国家安全等多领域风险挑战,人类经济社会各领域的生产关系面临一场为适应新质生产力发展需求的生产模式革命。在此期间,生成式人工智能技术(GenAI)创新中的开源创新与闭源商业之争愈加凸显,经典的开源创新公地治理机制面临挑战,开源创新范式正经历从开源软件到开源人工智能的深刻转型,在开源逻辑、基础设施和知识产权方面引发根本性变化。
开源的价值逻辑层面。开源软件源于20世纪70年代的学术共享传统,以源代码开放为核心,通过许可证机制(如GPL)促进协作创新,价值逻辑侧重于降低开发成本、打破商业垄断;而开源AI则扩展到模型参数、训练数据、算法架构乃至整个训练过程,其逻辑更强调应对技术发展的不确定性、激发全球群体智慧、保障安全透明和普惠性访问。例如,深度求索公司的DeepSeek开源大模型不仅开放代码,还公开参数权重和训练日志,定义了开放科学(如研究论文、数据集)、开放工具(如训练代码)和开放模型(如模型架构)的多层次开源结构,体现了开源AI对全要素开放的新要求:开源不仅促进创新,还须平衡公地价值供给与公共风险识别。
在基础设施供给层面。开源软件主要依赖代码托管平台(如GitHub)、版本控制工具和互联网连接,基础设施相对轻量且标准化。相比之下,开源AI需要高性能GPU集群等庞大昂贵的算力资源、大规模数据存储与处理平台及可持续的能源供给,大模型的训练成本随参数规模指数级增长。例如,以OpenAI GPT-3训练过程为例,GPT-3包含1750亿参数规模,其训练过程使用了大约128.7万度电力,相当于美国约121个家庭1年合计用电量;而下一代的GPT-4包含1.8万亿级参数,随着参数规模扩大,算力能耗也会指数级增加,GPT-4仅1次训练消耗2.4亿度电力资源,相当于数万个家庭年用电量,形成“资源密集型+知识密集型”的双密集型公共基础设施需求。这使得开源AI基础设施投入不仅仅是企业的商业行为,更成为国家战略资源投入。
在知识产权方面,开源软件通过开源许可证机制明确了源代码的使用、修改和分发规则,制度性的共识机制相对成熟。开源AI系统则涉及更复杂的知识产权问题,包括训练数据归属、算力调度机制、模型参数权重,以及算法伦理冲突等,现有开源许可证难以覆盖数据、模型等新元素,导致“治理真空”。例如,美国Meta公司的Llama模型曾因数据泄露引发争议。此外,开源AI面临的恶意使用等安全风险迫切要求出台新型责任框架。再如,欧盟酝酿的《人工智能法》尝试区分开发者与部署者责任,但开源社区的分布式特性使合规挑战加剧。
综上,开源AI在逻辑从代码开源协作转向全链条生态开放,基础设施从软件工具转向算力与数据综合体,知识产权从开源许可转向多维治理。上述变化对大模型的开源治理机制构成重大挑战。
大模型开源创新中的要素变化及治理转型
如何有效治理大模型开源创新活动对大模型技术健康发展、实现产业应用、造福人类社会至关重要;在大模型技术发展变革中,治理主体的多元性和公共性已经成为治理变革的关键组织要素,本研究将以本轮大模型技术革命的发源地美国的开放人工智能中心(OpenAI)和美国国家人工智能研究资源试点(NAIRR)给AI大模型发展中的组织结构调整和治理要素带来的变化,进行更深入的案例分析。其典型意义体现在:① OpenAI和NAIRR是美国进行AI创新研发和治理的典型案例,二者除了治理结构之外,面对的其他控制变量基本保持一致;② 美国是本轮大模型技术发源地,目前的发展也相对更为成熟;③ 美国是完整经历了开源创新的自由软件阶段、开源软件阶段和开放智能阶段三大信息技术发展阶段,具有时空代表性;④ 美国作为“自由市场国家”的代表,政府参与大模型开源公地的治理是一个“最不可能案例”,更能凸显大模型开源治理的政府主体参与的重要性。
具体地,作为本轮大模型技术革命先行者,OpenAI在创始之初曾作为“非营利性机构”进行研发活动,在其发展过程中,为跨越能源陷阱、算力依赖和数据瓶颈,其自2019年起有计划地实施营利性、私有化的组织治理结构转型,但其对创新公地的攫取和私有化改造,潜在构成对大模型技术发展及人类社会福祉的危害。在此背景下,美国政府推动国家科学基金会(NSF)牵头发布了NAIRR,以政府力量调动资源参与大模型等人工智能前沿科学技术的创新公地资源建设,协调社会、市场和各级政府部门的创新资源投入和利用,积极纳入政府的“有形之手”建设和维护大模型创新公地。
OpenAI转型为营利机构:社会—市场主导的大模型创新成本陷阱与治理失衡
OpenAI最初于2015年以非营利机构形式成立,旨在推动人工智能技术的开放普惠发展。其早期的“开放源代码+社会资助”模式有助于汇聚创新资源、吸引人才和降低商业压力。然而,随着大模型研发投入剧增、算力和数据成本飙升,单纯依靠社会捐赠与市场投资的模式难以支撑持续创新。
2019年起,OpenAI逐渐向“有限利润公司”转型,通过引入微软等投资者,形成“非营利控制、营利运营”的混合治理架构(图1)。该模式试图在公共利益与商业激励间平衡:非营利机构控制战略方向,营利公司负责产品化与资本运作。然而,随着2022年ChatGPT的爆发式成功,控制权逐步向投资方倾斜,非营利目标被削弱,开源转向闭源,利润优先取代公共导向。
2024年起,OpenAI数次调整股权安排与组织结构,核心业务转入营利公司,非营利机构退居为少数股东。这显示出“社会-市场”合作治理在大模型开源创新发展中的内在困境:一方面创新成本高企、收益周期漫长,资本驱动易导致技术封闭与利益集中;另一方面,缺乏公共权威介入,公共风险管理与社会伦理约束机制薄弱。
在此背景下,美国政府通过制度化干预,推出以公共资源为核心的人工智能开源创新治理机制,即NAIRR计划。

NSF推出NAIRR计划:政府引导的人工智能开源创新公地建设
2024年,美国NSF启动NAIRR计划,这是美国政府正式进入大模型开源治理领域的标志性事件之一。NAIRR联合了10个联邦机构和25家社会、市场主体,共建国家级人工智能开源基础设施,目标是通过公共算力、数据集和模型资源的共享,打造可持续的“人工智能国家创新公地”。
NAIRR涵盖四大模块,包括AI开源共享、AI安全隐私、AI软件服务和AI教育培训,分别对应AI的资源开放、安全问题、技术互操作性和新一代人才培养。NSF通过阶段性目标、里程碑和责任机制推进实施,目前已进入第3阶段(图2)。在治理机制上,NAIRR以联邦政府为主导,整合科研机构、企业与社会团体共同参与,建立伦理与安全顾问机制,推动AI的开放、公平与安全标准制定。2025年后,NSF推出了NAIRR运营中心(NAIRR-OC),创立招标与资助计划,标志着从试点向长期国家级AI资源基础设施过渡,这不仅有望缓解大模型市场化创新中的成本与垄断风险,也通过公共资源配置与政策引导,为AI开源创新构建更加长期稳定的制度基础。

综上,OpenAI模式揭示了社会与市场主导的开源创新在高成本与高风险领域的局限,而NAIRR计划体现出政府介入以制度化方式重塑开源治理体系的趋势。这标志着大模型创新治理从“社会-市场”双元结构迈向“社会-市场-政府”三元共治的新阶段。
比较分析:“社会-市场-政府”的三位一体治理特征
NAIRR的推出标志着AI开源治理从依赖社会与市场的“自组织式创新”迈向由政府引导的“制度化治理”。这一转向并非简单的资源再分配,而是应对大模型技术高投入、高风险、强外部性的结构性挑战。
在创新投入层面,政府主导的公共资源体系为科研机构、中小企业和教育机构提供了与大型科技公司竞争的基础条件,缓解了算力和数据集中带来的创新门槛效应。 在风险治理层面,NAIRR通过设立伦理顾问委员会和安全监管机制,将社会公共价值纳入AI研发过程,实现技术创新与公共利益的制度性对接。 在全球竞争层面,NAIRR强化了美国在AI开源标准和伦理治理领域的国际话语权,形成以公共资源和政策协调为核心的国家级创新公地。
综上所述,从OpenAI的转型与治理困境,到NAIRR对人工智能公共资源提供方式的重塑,发现大模型开源治理逻辑的演变:在社会参与阶段依靠科研共同体与开源社群推动技术突破;在市场参与阶段通过资本投入加速技术应用与商业化;在政府参与阶段则以制度设计整合社会与市场力量,构建公共导向、风险可控、可持续发展的开源创新体系。大模型开源治理的最大变化不在技术层面,而在于治理主体的扩展与结构性重构——政府不再只是监管者,而成为开源创新的共同建设者与制度供给者。这一“社会-市场-政府”三元共治框架,为全球AI治理提供了新的制度范式。
大模型开源公地治理新范式
基于对OpenAI与NAIRR的比较研究,本研究发现大模型技术的发展已突破传统开源治理的合作模式。高研发成本、强外部性和系统性风险使社会与市场主导的开源公地模式陷入失灵,亟待引入政府力量形成新的治理范式。大模型开源治理的特征表现为:营利边界模糊、治理要素动态、机制多元,促使治理体系从社会-市场双元结构,演化为包含政府主体的三元共治模式。
具体地,大模型技术发展对经典的开源创新模式的变革性影响体现在3个方面。
行动角色更多样。随着大模型技术的兴起与加速普及,技术创新者、技术使用者和监管者之间的行动角色划分、主体边界界定及权责范畴配置,相较于开源软件阶段呈现出更为复杂的结构,创新组织的产权属性和治理结构变化成为常态,治理主体从社会和市场主体拓展到社会、市场和政府主体三元共治,治理维度从软件源代码等技术本身拓展到技术发展、市场应用、社会伦理及法律、国家安全等多重维度。
治理环节更多元。大模型创新研发和产业化应用所涉及的治理环节除了软件源代码的生产和分发外,还包括大模型训练过程、训练数据、模型参数、推理过程、推理结果、开发工具、硬件资源、应用接口等全链条全环节,相较于开源软件,大模型的开源治理环节更庞杂。
治理维度更复杂。大模型治理的机制性维度也变得更为复杂,大模型技术发展所引发的技术风险、市场风险、社会伦理风险、国家安全风险等超越了开源软件阶段的治理机制所辖范畴,溢出到人类经济社会生活的方方面面。基于此,有必要在公地理论框架下,对形成于开源软件阶段的既有治理机制进行制度层面的深化与拓展,从而更有效回应大模型开源治理所面临的需求结构与风险挑战。
新的行动角色及其治理维度
在大模型技术演进过程中,开源创新活动从自发技术秩序转向有组织的协作,并形成了多元化的行动角色;政府逐步承担了一部分开源创新公地的维护责任,帮助市场主体降低创新边际成本,提升社会主体的创新活力。在此背景下,社会、市场、政府三类主体均须根据技术发展与外部环境变化,动态性地承担创新者、使用者、监管者的行动角色。本研究面向新的行动角色,聚焦技术研发领域、市场应用领域、社会伦理及法律规制领域、国家安全领域4个维度,提出大模型开源治理机制框架(表3)。

对大模型创新主体,其行动决策的关键是不确定性管理,因此这类行的角色更关注市场维度的投资回报、产业落地、数据权属等,目标是形成可持续的投入—产出闭环与可复制的产业路径。 对大模型使用主体,其行动决策的关键是大模型广泛应用带来的教育、就业、隐私、人机边界等社会伦理与法律风险,保障公平可及与基本权利。 对大模型监管主体,其行动决策的关键包括技术治理维度的算法透明度与可解释性,市场治理维度的基础设施投入与全社会研发成本,社会治理维度的教育变革、就业替代等挑战,安全治理维度的数据安全、资源滥用、新型网络攻击与智能化战争等系统性安全风险。
大模型的开源治理机制设计须能支持3类主体在不同行动角色中的灵活切换,实现大模型创新应用的有效产出与服务优化,在创新涌现、规模生产与社会福祉之间取得动态平衡,提升全社会创新协作效能。
新的治理环节及其治理机制
更进一步,与开源软件的治理机制相比,大模型的研发与应用涵盖训练、数据、算法、硬件与接口等多个层面,治理环节更为复杂,涉及从算力供给到算法优化的完整创新链条。大模型开源治理可归纳为算力、数据与算法3个核心环节,它们共同构成大模型创新公地的制度支撑。
算力是大模型技术的基础性资源,也是治理中最突出的制约因素。随着模型规模持续扩大,算力消耗带来了前所未有的能源与环境压力。国际能源署(IEA)2025年发布的《能源与人工智能》报告显示,2025年全球用于AI基础设施整体(包括AI模型预训练、后训练、推理等)的电力需求占全球总电力需求的3.2%左右,比2024年上升1.5%—2%。然而,全球高端算力资源集中于少数国家及科技巨头,形成新的全球资源垄断格局,被学界称为“数字帝国主义”。这种不均衡不仅造成能源消耗与生态负担,也强化了技术主导权和地缘政治风险,亟待通过开源治理机制推动算力资源的开放共享,建立跨机构、跨国界的协调机制,以保障算力资源的公平、可持续与安全使用。
数据是大模型的治理基石,也是影响创新质量的核心要素。随着高质量自然数据逐渐稀缺,大模型训练面临“数据枯竭”困境,同时引发大规模版权与隐私争议。2023—2025年,OpenAI因未经授权使用新闻与文学作品训练模型遭多起诉讼,表明数据获取与使用的法律边界亟待明确。为缓解数据短缺,部分企业开始采用合成数据进行训练,但其真实性与模型鲁棒性仍存在不确定性。数据跨域流通受制于产权模糊、合规复杂与追溯困难,形成治理瓶颈。在此背景下,开源为数据治理提供了新的制度思路:以开放协作为核心价值,通过建立分级分类的数据管理体系和透明的流通机制,形成来源可追溯、权属可界定、使用可监管的开放体系,从而在开放与安全之间实现平衡。
算法是大模型治理的核心,算法的不透明性与不可解释性带来了新的技术与社会风险。当前基于神经网络的大模型技术路径仍存在“黑箱推理”和“灾难性遗忘”等问题,导致模型难以在复杂任务中保持逻辑一致性和领域通用性;算法缺乏可解释性,使其在决策、教育、医疗等领域的应用具有不确定性。因此,大模型算法的负外部性正在显现。例如,美国麻省理工学院(MIT)与橡树岭国家实验室(ORNL)于2025年发布的联合研究,使用“冰山指数”模型,发现截至2025年,现有的AI技术已经具备能力替代美国劳动力市场中11.7%的工作任务,对应约1800万全职劳动者工作量,涉及的工资规模约为1.2万亿美元,最易受影响领域包括金融、医疗保健、专业服务(如法律、会计)等“高级白领”职业,加剧了就业结构变革,将引发更复杂的经济社会连锁反应。此外,全球主流大模型语料中语言分布极度不均衡,例如,GPT系列模型的训练数据中,中文语料占比普遍估计在1%—3%之间,这一结构性偏差正进一步放大数字主权与意识形态风险,引发新的国际竞争与安全挑战,为此,欧洲开始以“数字主权”为核心议题推动相关立法。
结论与讨论
研究发现,在大模型开源创新公地的建设和治理中,传统的开源创新模式面临新冲击,治理范式向社会-市场-政府“三元共治”转型,体现了科学共同体合作、应对技术不确定性与重塑市场竞争格局的特征。以大模型为代表的通用人工智能技术正重塑开源创新模式。大模型高昂的训练成本、产业化盈利路径的不确定性及社会风险外溢,使得传统由社会与市场主导的开源治理结构难以为继。大模型开源创新公地的建设已无法依赖单一社区或企业,需要国家力量积极介入,以算力、数据和算法为核心环节,构建三元共治的开源创新公地治理新框架。
结论与贡献
AI大模型作为典型的新质生产力,重构了开源创新的3个问题。 在研发生产层面,大国博弈、资本预期与社会伦理分歧加剧了多元主体间的共识危机; 在技术演化层面,模型内生的不可解释性与外生应用的不确定性,使技术、市场、伦理、法律与国家安全等多维风险交织叠加; 在市场竞争层面,非线性的成本收益结构、专用芯片短缺及高质量人类反馈数据匮乏,制约了商业变现效率。
研究聚焦AI大模型作为新质生产力对开源创新规律的重构,通过对比美国OpenAI转型与NAIRR计划案例,得出3个核心结论。 面对大模型在研发路线、技术风险及市场变现层面的三重挑战,研究发现大模型开源治理正从传统的“社会-市场”二元自组织模式,加速向“社会-市场-政府”三元协同共治范式转型; 政府已从创新的“旁观者”转变为“共建者”,通过制度供给、战略投资及算力、数据、算法基础设施布局,有效降低全社会创新成本,并在技术透明度、价值对齐及系统性风险缓释上提供可信承诺; 研究提出了涵盖三大角色(创新者、使用者、监管者)、三大环节(算力、数据、算法)及四大维度(技术、市场、社会、国家安全)的大模型开源治理机制框架,旨在构建可持续的大模型开源创新公地。
研究拓展了公地治理理论边界,将公地治理理论延伸至人工智能新质生产力语境。 证实并阐释了开源组织模式由二元结构向三元协同的演进机制,明确了政府在提供创新公共品、稳定市场预期及制定标准规则中的关键主体地位; 揭示了多元主体在创新全生命周期中的动态角色转换规律,提出单一主体需根据技术迭代与风险耦合情况,在创新者、使用者与监管者逻辑间灵活切换,为监管边界与协同方式的再设计提供依据; 构建了多维联动的系统化分析框架,填补了大模型时代开源创新治理机制的理论缺憾,为全球人工智能开源生态的制度设计提供学理支撑与实践路径。
政策启示
本研究揭示了大模型开源治理的核心规律:技术进步推动治理结构变革,而新的治理机制又反过来促进新质生产力发展,形成“技术—制度—生产力”循环演化的内在逻辑,从而构建了为有为政府、有效市场与有机社会的协同提供可操作路径,为创新者、使用者与监管者的策略选择提供依据,为我国推动人工智能开源创新提供3个方面政策启示。
在算法治理方面,应主导建立AI开源伦理与技术标准的国际对话平台。鼓励市场主体在预训练后、领域微调前进行算法风险评估与备案,既保障创新活力,又防止模型滥用。政府应支持形成以“社区-市场-政府”协同为核心的治理机制,推动一揽子政策落地于技术研发、能源保障、数据治理和社会安全等领域。
在算力治理方面,应加快国产算力平台和算力网建设。通过国家实验室与算力网统筹算力资源,实现跨区域调度与共享,为科研机构与高校提供普惠算力支持,降低研发门槛,形成可持续的AI算力供给制度与可复用的AI算力度量标准。
在数据治理方面,应依托国内开源社区建设跨平台数据协作机制。推动在CCF GitLink、ModelScope、OpenI等中国开源平台和开源社区发布基础模型,实现与GitHub平台项目的同步更新与共享,打通数据流通壁垒,培育具有全球影响力的中国开源生态,最终形成以公共数据、开放算法和自主算力为基础的AI开源创新公地。
(作者:王哲, 北京航空航天大学 人文社会科学学院(公共管理学院)、复杂关键软件环境全国重点实验室;蔡劲松,北京航空航天大学 人文社会科学学院(公共管理学院)。《中国科学院院刊》供稿)







