第10版:理论

构建AI大模型合法运行框架 版权、合规与隐私保护

□高泺云

当前,人工智能(以下简称“AI”)大模型训练数据获取频涉版权争议,服务提供存在违规与冒用,个人信息捕捉涉嫌隐私侵犯。为解决这些问题,需明确数据来源,合法获取信息并建立补偿机制,依法备案AI模型并打击冒用,同时研发者应主动接受监管。

关键词:AI大模型;版权;合规;隐私

引言

人工智能大模型的发展带来了版权争议,尤其是在内容的独创性和作者身份上。尽管政策和学术界努力通过规范解决这些问题,如《新一代人工智能发展规划》和《生成式人工智能服务管理暂行办法》,但争议仍存。为解决这些问题,可以从规制AI模型运行的角度入手,确保其过程合法,以此间接解决AI生成内容的版权属性问题。这需要关注到版权、合规审查和个人信息保护等方面。

从版权到隐私

AI大模型运行模式中的多重法律挑战

首先,在人工智能大模型的训练过程中,存在可能侵犯版权的情况,尤其是在数据获取环节。例如,在《纽约时报》诉OpenAI这一案例当中,《纽约时报》指称OpenAI在未获得授权的状况下运用其文章来训练ChatGPT模型,这一情况呈现出了“接触+实质性相似” 的版权侵权判定准则。该案例表明,未经许可运用版权作品来训练模型具有一定的法律风险。

其次,AI大模型所提供的服务在合法性方面也遭受质疑。像国内首起AI品牌维权案件,即阿里云计算有限公司起诉被告侵犯商标权以及实施不正当竞争,还有李一舟的AI培训课程涉嫌非法运营以及盗用模型等问题,这些均反映出AI服务在合规性方面仍旧存在争议和挑战。

最后,AI大模型在获取个人信息的时候,例如人脸图像等,由于其用途难以进行有效监督,从而引发了隐私方面的担忧。比如虞某某利用“AI换脸”技术侵犯个人信息,以及ChatGPT因在未充分告知用户的情况下就收集个人信息而被起诉,这些均显示出AI在个人信息获取方面存在的合法性问题。

AI大模型运行模式中

版权、合规与隐私问题的根源

首先,AI大模型训练数据获取常违反版权法,因其多使用受版权保护的作品而未获授权,或未经许可获取数据库信息,可能构成不正当竞争。高质量版权作品和有偿数据库信息作为训练素材,未经许可使用即构成侵权。尽管第三类公共领域作品或版权过期作品可自由使用,但其价值较低。现实中,AI模型很难获得必要授权,导致训练方式违反版权法及商业习惯。

其次,AI大模型服务提供存在违规、冒用现象,如未按法规要求备案、盗用模型、未签用户协议等问题。例如,“通义千问”冒用案中,被告提供非官方APP下载服务,误导公众;李一舟争议事件中,“一舟智能”未备案且涉嫌侵权。此外,一些AI平台未与用户签订协议,导致在用户数据处理、隐私保护及责任界定等方面缺乏依据,引发争议。

最后,个人信息捕捉方面,AI大模型在收集、存储、使用用户信息时,缺乏有效监管,可能导致隐私泄露。无论是微信绑定、人脸识别还是记忆验证,个人信息均被平台收集,但平台往往缺乏必要的用户协议,信息处理合法性存疑。数据训练后的内容生成也可能擅自利用个人信息,甚至平台或其工作人员可能违法出售个人隐私信息,如“AI换脸”技术和违法出售信息等事件,凸显了个人信息捕捉合法性问题。

构建AI大模型合法运行框架的策略

首先,为解决AI大模型训练数据获取违反版权法的问题,需明确数据来源、合法获取信息并建立补偿机制。首先,对数据来源进行标识,尊重数据权益所有人。其次,合法获取信息,包括征得原作者或权利人授权、与信息服务平台签订合同,并征得用户许可收集个人信息。最后,建立补偿机制,对未经授权使用的作品、数据或个人信息进行补偿。

其次,为减少AI大模型服务的合法性争论,需依法依规备案并打击模型冒用。加强监管力度,督促服务提供者依法备案,并与用户签订协议,明确双方权利义务。严厉打击冒用、盗用行为,从法律上从严处罚,维护合法服务提供者的权益。

最后,AI大模型研发者应尽注意义务,主动接受监管。不将捕捉到的个人隐私用于训练,甄别并阻止违法指令,通过用户协议明确个人信息的采集范围和用途。主动备案个人信息收集情况,并向社会公开,消除个人信息流向疑虑,促进行业自律和技术进步。

结语

保护知识产权就是保护创新。分析AI大模型的运行模式合法性,为AI生成内容的版权保护提供了新思路,突破了单纯讨论生成内容可版权性的局限。确保AI大模型在训练数据获取、服务提供及个人信息捕捉等方面的合法性,是解决版权争议的关键,也是维持AI行业健康发展的基础。在“边发展边监管”的理念下,AI大模型将持续发展,相关的合法权益也将得到保障。相信我国能够在知识产权保护上交出令人满意的答卷。

参考文献:

[1]高阳,胡丹阳.《机器学习对著作权合理使用制度的挑战与应对》,《电子知识产权》2020年第41期,第24页

[2]刘友华,魏远山.《机器学习的著作权侵权问题及其解决》,《华东政法大学学报》2019年第22 期,第75页

[3]张平.《生成式人工智能实现突破创新需要良法善治——以数据训练合法性为例》,《新经济导刊》2023年第08期,第27页

(作者单位:华东政法大学,上海市201620)

2024-11-21 2 2 河北经济日报 con162309.html 1 构建AI大模型合法运行框架 版权、合规与隐私保护