构建AI大模型合法运行框架版权、合规与隐私保护河北经济日报·数字报

第10版：理论

上一版下一版

返回栏目下一篇

放大+ 缩小- 默认o

构建AI大模型合法运行框架版权、合规与隐私保护

□高泺云

当前，人工智能（以下简称“AI”）大模型训练数据获取频涉版权争议，服务提供存在违规与冒用，个人信息捕捉涉嫌隐私侵犯。为解决这些问题，需明确数据来源，合法获取信息并建立补偿机制，依法备案AI模型并打击冒用，同时研发者应主动接受监管。

关键词：AI大模型；版权；合规；隐私

引言

人工智能大模型的发展带来了版权争议，尤其是在内容的独创性和作者身份上。尽管政策和学术界努力通过规范解决这些问题，如《新一代人工智能发展规划》和《生成式人工智能服务管理暂行办法》，但争议仍存。为解决这些问题，可以从规制AI模型运行的角度入手，确保其过程合法，以此间接解决AI生成内容的版权属性问题。这需要关注到版权、合规审查和个人信息保护等方面。

从版权到隐私

AI大模型运行模式中的多重法律挑战

首先，在人工智能大模型的训练过程中，存在可能侵犯版权的情况，尤其是在数据获取环节。例如，在《纽约时报》诉OpenAI这一案例当中，《纽约时报》指称OpenAI在未获得授权的状况下运用其文章来训练ChatGPT模型，这一情况呈现出了“接触+实质性相似” 的版权侵权判定准则。该案例表明，未经许可运用版权作品来训练模型具有一定的法律风险。

其次，AI大模型所提供的服务在合法性方面也遭受质疑。像国内首起AI品牌维权案件，即阿里云计算有限公司起诉被告侵犯商标权以及实施不正当竞争，还有李一舟的AI培训课程涉嫌非法运营以及盗用模型等问题，这些均反映出AI服务在合规性方面仍旧存在争议和挑战。

最后，AI大模型在获取个人信息的时候，例如人脸图像等，由于其用途难以进行有效监督，从而引发了隐私方面的担忧。比如虞某某利用“AI换脸”技术侵犯个人信息，以及ChatGPT因在未充分告知用户的情况下就收集个人信息而被起诉，这些均显示出AI在个人信息获取方面存在的合法性问题。

AI大模型运行模式中

版权、合规与隐私问题的根源

首先，AI大模型训练数据获取常违反版权法，因其多使用受版权保护的作品而未获授权，或未经许可获取数据库信息，可能构成不正当竞争。高质量版权作品和有偿数据库信息作为训练素材，未经许可使用即构成侵权。尽管第三类公共领域作品或版权过期作品可自由使用，但其价值较低。现实中，AI模型很难获得必要授权，导致训练方式违反版权法及商业习惯。

其次，AI大模型服务提供存在违规、冒用现象，如未按法规要求备案、盗用模型、未签用户协议等问题。例如，“通义千问”冒用案中，被告提供非官方APP下载服务，误导公众；李一舟争议事件中，“一舟智能”未备案且涉嫌侵权。此外，一些AI平台未与用户签订协议，导致在用户数据处理、隐私保护及责任界定等方面缺乏依据，引发争议。

最后，个人信息捕捉方面，AI大模型在收集、存储、使用用户信息时，缺乏有效监管，可能导致隐私泄露。无论是微信绑定、人脸识别还是记忆验证，个人信息均被平台收集，但平台往往缺乏必要的用户协议，信息处理合法性存疑。数据训练后的内容生成也可能擅自利用个人信息，甚至平台或其工作人员可能违法出售个人隐私信息，如“AI换脸”技术和违法出售信息等事件，凸显了个人信息捕捉合法性问题。

构建AI大模型合法运行框架的策略

首先，为解决AI大模型训练数据获取违反版权法的问题，需明确数据来源、合法获取信息并建立补偿机制。首先，对数据来源进行标识，尊重数据权益所有人。其次，合法获取信息，包括征得原作者或权利人授权、与信息服务平台签订合同，并征得用户许可收集个人信息。最后，建立补偿机制，对未经授权使用的作品、数据或个人信息进行补偿。

其次，为减少AI大模型服务的合法性争论，需依法依规备案并打击模型冒用。加强监管力度，督促服务提供者依法备案，并与用户签订协议，明确双方权利义务。严厉打击冒用、盗用行为，从法律上从严处罚，维护合法服务提供者的权益。

最后，AI大模型研发者应尽注意义务，主动接受监管。不将捕捉到的个人隐私用于训练，甄别并阻止违法指令，通过用户协议明确个人信息的采集范围和用途。主动备案个人信息收集情况，并向社会公开，消除个人信息流向疑虑，促进行业自律和技术进步。

结语

保护知识产权就是保护创新。分析AI大模型的运行模式合法性，为AI生成内容的版权保护提供了新思路，突破了单纯讨论生成内容可版权性的局限。确保AI大模型在训练数据获取、服务提供及个人信息捕捉等方面的合法性，是解决版权争议的关键，也是维持AI行业健康发展的基础。在“边发展边监管”的理念下，AI大模型将持续发展，相关的合法权益也将得到保障。相信我国能够在知识产权保护上交出令人满意的答卷。

参考文献：

[1]高阳，胡丹阳.《机器学习对著作权合理使用制度的挑战与应对》，《电子知识产权》2020年第41期，第24页

[2]刘友华，魏远山.《机器学习的著作权侵权问题及其解决》，《华东政法大学学报》2019年第22 期，第75页

[3]张平.《生成式人工智能实现突破创新需要良法善治——以数据训练合法性为例》，《新经济导刊》2023年第08期，第27页

（作者单位：华东政法大学，上海市201620）

构建AI大模型合法运行框架 版权、合规与隐私保护

构建AI大模型合法运行框架版权、合规与隐私保护