


AI模型知识产权保护的多元路径构建及实务建议
随着人工智能技术的迅猛发展,AI模型的法律保护问题日益成为国内外关注的焦点。北京知识产权法院于2025年二审审结的抖音诉亿睿科“变身漫画特效”案引发热议,该案明确了AI模型结构与参数属于受《反不正当竞争法》保护的竞争利益,并入选了最高人民法院发布的2025年典型竞争案例。以该案为切入点,当前AI模型法律保护主要面临三大核心争议与难点:一是法律定性难题,即AI模型究竟属于何种法律保护客体;二是侵权认定标准争议,在判定AI模型侵权时,核心依据应主要关注生成内容效果的比对,还是必须深入底层,对模型结构、参数及其他技术信息进行逐一比对?尤其针对模型蒸馏等新兴技术,若行为人仅模仿功能逻辑而未直接复制代码,此类行为的侵权认定与标准适用尚不明确;三是权益保护的边界问题,即行为正当性边界与是否违反商业道德的认定标准如何确定。此外,若模型训练过程中存在数据来源合法性瑕疵或违反开源协议,其最终模型成果是否以及可以在何种程度上受到法律保护,亦有待进一步明晰。下文将结合国内外法律规则、司法实践与基础理论,对上述问题展开梳理。
(参见北京知识产权法院(2023)京73民终3802号民事判决书。)

一、AI模型的内涵及其技术拆解

AI模型指一种经由数据训练而得到的参数化函数映射系统。该系统能够接收输入数据,并依据其内部结构和参数进行运算,生成诸如文本、图像等输出。AI模型的法律定性是构建其法律保护体系的逻辑起点。鉴于AI模型在技术属性上与计算机软件具有高度的相似性与关联性,且现行法律已具备成熟的软件保护框架,判定AI模型是否属于“计算机软件”是探讨其法律保护路径时首先需明确的关键问题。
然而,AI模型并非单一的整体,其研发与应用涵盖了复杂的流程。从完整训练链条来看,首先需要准备和标注数据,随后进行模型训练与优化,并结合具体任务目标,在算法和结构等方面对模型进行调整,通过反向传播等机制持续迭代。训练完成后,需经过推理验证,最终得到模型核心的权重文件,通过API或其他形式开放应用,实现商业化落地。从技术构成与实践应用上看,一个完整的AI模型通常以一组可交付文件形式呈现,其中主要包括:模型权重文件、模型架构配置文件、分词器文件以及用于训练和推理的源代码等。这些文件共同组成了模型应用的技术基础,支撑其在实际场景中的部署与运行。

具体而言,权重文件作为核心载体,存储了训练得到的全部参数;架构配置文件以结构化方式定义了网络层数、注意力头数等超参数;分词器文件则包含词汇表和编码规则,负责对输入文本进行预处理。此外,用于训练和推理的源代码包含了模型实现、数据预处理及训练逻辑。这些文件共同构成了模型部署与运行的技术基础。在开源场景下,公开前三种文件通常已可实现模型的直接应用与推理复现;然而,若要完全从零开始训练出相同模型,则必须参考包含完整训练逻辑与预处理脚本的源代码。正因如此,AI模型并非单一实体,而是由内容、形态与性质各异的多个部分组成,这一特点直接决定了其各组成部分在知识产权法上可获得保护的类型与方式也各不相同,这也是构建AI模型知识产权多元保护体系的基础和内在要求。

二、AI模型知识产权多元保护路径的构建

依据《计算机软件保护条例》及TRIPS、WCT等国际公约的通行标准,“计算机软件”的保护客体主要被限定为“代码化指令序列(程序)”和“描述性文字资料(文档)”。AI模型的推理与训练代码、架构配置文件及分词器等,因具备明确的人类可读性或指令属性,较易被认定为“计算机程序”或“软件文档”,纳入现行法的保护范畴。相比之下,核心权重文件的法律属性界定困难显著,难以被认定为现行著作权法意义上的计算机软件。
一方面,权重文件的本质是浮点数集合,它并不包含传统计算机程序所必备的逻辑指令序列,仅作为被推理代码读取和调用的参数存在。且它具有显著的“黑盒”特性,人类无法通过阅读权重来理解逻辑,也无法像修改代码那样直接通过调整参数来修补模型。另一方面,它也不符合法律对文档的界定。其并非具备描述功能的文字资料,而是经海量数据运算后生成的、人类无法直接解读的数字矩阵,更近似于一种数学事实,而非描述性文字。
更进一步而言,模型权重文件不仅无法被归入计算机软件的保护范围,亦难以作为普通文字作品或汇编作品获得著作权法保护。原因在于,其一,权重文件的功能必须依托特定推理引擎的调用才能得以实现,其自身不具备可向公众直接呈现、能够传递思想内涵或具备审美价值的外化表达;其二,从生成机制来看,模型权重是算法基于预设目标函数,在海量数据基础上自动迭代运算所得到的最优解。这一过程的本质是纯粹数学推演,非人类作者对表达内容的自主选择与个性化编排,难以体现著作权法意义上的“独创性”,更近似于对客观数学事实的发现。
当前,模型权重文件因其特性而难以直接获得版权保护。理论上虽可通过对“独创性”要件的扩张解释寻求突破,但这在实践中仍面临巨大挑战。纵观计算机软件的保护历程,对于这类需要国际协调与共识的复杂智力成果,试图为其创设一套全新的独立保护体系异常艰难。相比之下,采纳版权法、专利法与反不正当竞争法并行的多元保护路径,是更为合理且可行的现实选择。作为价值密度更高的新型客体,AI模型的保护必将遵循并深化这一路径,最终构建一个由著作权、专利权、商业秘密及反不正当竞争兜底保护协同作用的多元保护体系。

简单来说,需针对AI模型的不同组件,构建差异化的知识产权保护方式。模型的核心权重与参数文件,因其可能被界定为数学事实或数据,在著作权与专利保护上均存在障碍,但其商业价值极高、保密性强且难以反向工程,故商业秘密是其核心保护方式,针对窃取行为可辅以反不正当竞争法救济。
训练与推理代码同传统软件,其表达受著作权保护,其中蕴含的创新技术方法可尝试申请专利,未公开的代码则可依赖商业秘密。模型架构与算法方面,架构配置文件可作为软件文档受版权保护,但算法作为思想虽不受版权保护,却是专利保护的重要客体。针对解决特定技术问题的模型架构、算法创新可申请专利保护,未公开的架构和算法同样可归入商业秘密。
训练数据集可通过著作权法对其独创性选择与编排提供有限保护,其经过深度加工的高质量数据集可作为商业秘密保护,依据商业秘密保护与反不正当竞争法抵御竞争对手的不当爬取与利用行为。系统指令与提示词的保护门槛较高,仅具备足够复杂性与独创性的组合才可能构成作品,但作为未公开的信息,亦可纳入商业秘密与反不正当竞争法的保护范围。
具体到各保护模式的适用,依然面临诸多待解的问题。在著作权法层面,需在AI语境下深化“思想与表达二分法”,厘清源代码中可受保护的表达范围,并完善AI输出内容中人类贡献与独创性的认定标准。在专利法层面,挑战在于如何将训练完成的模型或其底层算法,有效地“包装”为解决特定技术问题、具备技术效果的技术方案。此外,在开源算法普及的背景下,证明特定模型具备区别于现有技术的“创造性”也存在困难。在商业秘密层面,难点在于如何在开源生态中证明信息的“秘密性”。若可通过模型的输入输出映射被反向推导,其能否继续作为商业秘密保护,存在争议。在反不正当竞争法层面,核心在于如何精准界定行为的不正当性。这涉及对原告竞争投入、模型相似性的认定,以及在鼓励创新与公平竞争之间划清正当模仿与违法抄袭的行业界限。

三、AI模型“抄袭”行为的不正当竞争规制分析

鉴于反不正当竞争法针对AI模型的广泛补充保护功能,针对不同形态的AI模型“抄袭”行为也势必存在更多的适用场景。在“变身漫画特效”案中,我国司法实践也已明确将模型权重与参数视为竞争利益予以保护,故下文将围绕AI模型的反不正当竞争保护展开重点分析。
关于反不正当竞争法与著作权法的界分,是一个重要的理论议题,目前尚未形成通行的认定标准。特别是在处理那些不构成混淆的抄袭与“搭便车”行为时,各国对于是否以及如何以不正当竞争予以规制,态度并不明确。例如,美国虽通过1918年国际新闻案确立了不当占有原则(Misappropriation),但在后续的NBA诉Motorola案和Barclays Capital案中不断限缩其适用范围,设定了较高的门槛。英国法则持保守态度,未承认概括性的不正当竞争,对于不产生混淆的单纯模仿(Pure Imitation),往往视其为自由竞争的范畴不予规制。德国理论上将反不正当竞争法视为知识产权的“孵化器”,在实践适用中遵循特别法优于一般法以及模仿自由的原则,仅在存在额外不公平因素时才动用,如欺骗来源、不正当窃取等。
(参见International News Service v. Associated Press: 248 U.S. 215 (1918).)
在我国的司法实践中,虽然尚未形成统一的理论指导来区分不同的法律适用,但鉴于我国尚未建立完备的邻接权体系,法院出于防止权利过度扩张和形成垄断的考虑,往往倾向于运用反不正当竞争法对某些不适合纳入著作权法严格保护框架的利益(如游戏规则、作品元素)提供灵活保护。这种做法有助于避免轻易设定较高的保护水平,相关案例的裁判思路也隐含了这一价值取向。各国在实践中的差异并非优劣之争,而是各国在其法律体系内部实现逻辑自洽与利益平衡的系统性应对。
从根本上看,著作权法与反不正当竞争法在保护客体与底层逻辑上存在本质差异。著作权法旨在保护作者对其创作作品享有的专有权利,其逻辑主线围绕“作品”展开。权利人需证明,存在符合法定要件的作品,被告未经许可实施了复制或传播作品等受控行为。侵权一旦认定,即推定损害发生,后续主要围绕被告的抗辩理由是否成立以及具体的法律责任承担展开审理。
反不正当竞争法则以维护正当竞争秩序与消费者长远利益为核心,其规制对象是“不正当行为”。原告需证明,自身通过实质性投入形成了受保护的竞争利益,且该利益具有正当性与商业价值;被告以不当手段攫取或破坏了该竞争优势。这不仅要求证明被告获取了原告的智力成果,还需论证其行为手段、目的或结果具有不正当性,逾越了正当模仿的界限,违背诚信与商业道德,对原告市场利益造成了实际损害。同时,法院还须综合判断该行为是否损害竞争秩序与消费者利益。由此可见,反不正当竞争法的举证链条更长、要件更多,其证明难度与法律门槛远高于著作权法。

在“变身漫画特效”案中,双方围绕上述逻辑链条展开争议。在此类模型抄袭争议中,原告需要证明其通过实质性投入形成了受保护的竞争利益,并提供完整的研发证据链,包括资金和时间投入的证明,以及相关成果的创新性和市场影响力。此外,还需证明被告的模型与其模型构成实质性相似。
在不正当竞争纠纷案件中,对于实质性相似的判断,虽与著作权法相似,但二者的目的与侧重点不同。著作权法聚焦于表达形式的相似性,遵循“思想与表达二分”原则,保护的是独创性的表达。反不正当竞争法则关注整体功能、效果以及该相似性是否不当侵占了原告的竞争优势。就AI模型而言,其比对范围更广,可涵盖模型输出的质量、风格、核心功能等要素。关键在于,相似部分是否源自原告的实质性投入,并为其带来了独特的市场竞争优势。换言之,只要能够不当转移竞争优势,无论其属于“思想”或“表达”层面,均可纳入考量。因此,反不正当竞争法下的判断是技术与价值的复合判断,既需进行技术特征比对,也需进行价值评估,即被诉行为是否越过了正当模仿的边界,违反了商业道德并破坏了创新秩序。
如前所述,AI模型的核心价值通常体现在其参数权重与模型结构上,直接比对这些内部构成无疑是最佳的事实查明方式。然而,此类信息属于企业高度保密的核心资产,原告方在诉讼中往往难以取证或者通过举证责任倒置等方式要求被告方提供。基于相关实践经验,在原告方无法直接获取内部参数时,可通过多元技术手段构建证据链,以证明模型间的关联性及被告行为的不当性,例如,在“清华-斯坦福”模型抄袭争议中,被诉模型复现了基于未公开“清华简”数据训练出的古文字识别能力,并在完全相同案例上出现识别错误,这种通过独特功能或错误一致性的分析可成为证明实质性相似的有力证据。此外,结合我国近年来专利、计算机软件等技术类知识产权案件证据规则的发展,在原告方在其举证能力范围内已经尽力举证并达到初步证明标准的情况下,亦可以请求审理法院适用举证责任转移或者举证妨碍等规则,责令对方当事人承担相关事实的举证责任。

除AI模型参数与权重的直接抄袭外,实践中存在两种比较常见且争议较大的行为,即模型套壳与模型蒸馏。模型套壳是指经营者直接将他人的模型服务封装为自己的产品提供,自身不进行或仅进行微乎其微的研发投入。其商业模式完全依赖于原服务提供商在服务器、算力及模型维护上的持续核心投入,通常违反原厂商的API服务条款,且在宣传中往往将他人成果包装为“自研技术”,导致用户对产品来源的混淆。此类模型套壳行为直接剥夺了他方竞争优势与劳动成果,容易被认定为违反商业道德的搭便车行为,行为不正当性较为显著。
而模型蒸馏行为的性质则更为复杂和中性。蒸馏技术旨在训练一个更轻量化的“学生模型”,使其性能逼近规模更大、性能更强的“教师模型”,以解决模型复杂度与部署效率之间的矛盾,实现模型压缩与知识迁移。其并非直接复制教师模型的权重或数据,而是学习其内部的函数映射与推理模式,表现为对输出特征、中间表征或特征间关系的模仿。技术形态包括离线蒸馏、在线蒸馏、自蒸馏等。
由于蒸馏技术能显著降低计算成本、提升部署效率,已被广泛应用于产业实践,如微软Phi、阿里Qwen等模型,具有降低技术门槛、促进AI普及的积极社会价值。因此,蒸馏行为本身并不当然违法,其正当性边界取决于是否扭曲了公平的市场竞争秩序。若开发者通过蒸馏手段不当攫取了教师模型具有独特竞争优势的核心能力,或采取违约、技术规避等手段进行爬取与蒸馏,则可能违反不正当竞争法。在司法实践中,具体争议中的技术事实、手段的合规性、对教师模型市场的替代效应以及对商业道德的背离程度,均是影响行为性质判定的重要考量因素。

四、AI模型知识产权保护的实务建议

基于以上对AI模型特性及其保护路径的分析,本文认为,对于处于研发领先地位的AI企业而言,应从以下两方面开展权益保护及侵权风险防范:
一方面,为有效保护自身权益,应针对AI模型的不同组成部分采取差异化的知识产权保护策略,进行多元布局。
首先,对具有独创性表达的训练代码、推理代码、架构配置文件及分词器文件等源代码及相关文档,应及时完成著作权登记或备案,并系统保存开发过程中的需求文档、设计图纸、版本迭代记录等,构建并留存完整的权属证据链。
其次,将模型中创新的算法、独特架构、具有技术效果的数据处理方法或训练技巧,撰写为符合专利法要求的“技术方案”,重点阐明其解决的技术问题、采用的技术手段及实现的有益效果,并尽早提交发明专利申请,尤其应重视方法发明专利的布局。
最后,将模型权重参数、未公开的核心算法细节、高质量训练数据集及未公开的模型结构超参数等纳入商业秘密管理范畴,强化物理隔离与访问控制,对权重文件等关键数据进行加密存储与传输,确保核心资产处于保密状态。
另一方面,为防范潜在的侵权风险,应在技术层面与协议层面建立双重防控机制。
在技术层面,可部署主动追踪与识别机制。例如在训练数据中嵌入微量、不影响模型性能的专有数据,形成数据“指纹”。一旦在第三方模型输出中检测到该特征,即可作为其模型抄袭的关键证据。
在协议层面,应通过完善用户协议、API服务条款及开源许可证,清晰界定使用权限与行为边界。针对“模型套壳”行为,须设置明确的禁止条款;对于“模型蒸馏”行为,则应依据商业策略,在协议中明确选择完全禁止、有条件开放或要求正式授权。此外,若模型中使用了开源组件,必须审慎评估并严格遵守相应开源协议(如GPL、Apache、MIT等),以防范知识产权衍生风险与合规争议。

以上是笔者根据当前研究情况及实践经验提出的初步实务建议,仅供业界参考,欢迎对该话题感兴趣的同仁进一步交流讨论。


