文章主题:AI-Generated Content, 预训练大模型, 生成式对抗网络, 文本生成
“
2023年7月,世界人工智能大会在上海如期举办,关于机器人、人工智能的新一轮话题热度又直线上升。AIGC(AI-Generated Content,人工智能生成物,此类型AI亦称为生成式AI)自2022年开始迎来了高速发展,不仅与金融、传媒、娱乐、医疗、工业等各行业进行结合,以低成本、高效率的方式满足海量个性化需求,与此同时也孕育着行业业态的新模式。而对AIGC的规制,美国版权局于今年3月发布了关于包含AI生成内容之作品版权登记的政策声明(Copyright Registration Guidance: Works Containing Material Generated by Artificial Intelligence),我国也相应出台了《互联网信息服务深度合成管理规定》与《生成式人工智能服务管理暂行办法》。
本专题将结合国际上的规制现状,国内的政策解读,对人工智能生成物是否能够获得版权保护,如何避免人工智能生成物侵权,以及人工智能所涉及的伦理问题等展开一些列探讨与实务操作指引。
”
一、生成式AI的工作原理
《中国AIGC产业全景报告》 defines AIGC as AI-Generated Content, which refers to a technology that utilizes pre-trained large models and generative adversarial networks (GANs) to find patterns in existing data and generate related content through releasing generalization capabilities. Before delving into the legal disputes involving AIGC, let us first explore the meanings of pre-trained large models and generative adversarial networks.
预训练大模型(LLM)是一种深度学习技术,包含两大核心阶段:“预训练”与“指令微调”。首先,在大数据环境中,即未经标注的互联网文本等数据源上进行大规模预训练,使模型掌握通用性的语言规律;接着,在针对特定自然语言处理任务的小数据集上进行精细化的微调,迅速增强模型在该领域的性能,最后实现模型向可执行应用的转化。
生成式对抗网络(GAN)是一种由生成器和判别器组成的深度学习模型。生成器的主要任务是生成与真实数据相似的数据,而判别器则是判断生成器生成的数据与真实数据的差异。两者共同构成了一个动态的博弈过程,不断进行学习和优化。
我们以时下热门的图像生成式AI及文本生成式AI详细解释。
图像生成式AI,也被称为文本到图像(Text-To-Image,简称T2I),是一种基于给定文本描述来生成图像的AI系统。这个领域的发展得益于计算机视觉技术的进步以及深度生成网络研究的快速发展。当前,扩散模型(Diffusion Model)是最受欢迎的生成模型之一,因为它操作简单且生成图像的精度很高。这种模型的典型代表包括Stable Diffusion和Midjourney。早期的图像生成模型主要是通过对图像元素添加关键词,然后让指令词与图像信息进行匹配,从而实现用户输入文本,AI输出对应元素拼贴的效果。然而,扩散模型在此基础上进行了改进,它通过对图片添加噪声(noise),然后利用计算机神经网络的正向加噪和反向去噪过程来生成更高质量和更具创造性的图像。通过大量的学习和训练,AI可以从各种素材中学习,并生成最接近人类真实世界的数据。这种技术在许多领域都有广泛的应用,例如虚拟现实、游戏制作和广告设计等。随着AI技术的不断发展和完善,我们有理由相信,图像生成式的AI将会变得越来越成熟和强大。
我们再来看文本生成式AI。时下最火的产品莫过于ChatGPT4。
开头我们说过预训练大模型(LLM)包含了“预训练”和“微调”的的两段式练习,其实GPT在前两代的时候并没有展现出优于其他模型的性能,而到GPT3的时候,突破性地在两段式的基础上加入了in-context 学习方式,通过给模型做示范,让模型感知应该输出什么,而不是直接标记最优答案。GPT3通过引导式的学习方式,在超大模型上展现出了惊人的效果:只需要给出一个或者几个示范样例,模型就能照猫画虎地给出正确答案。而GPT4在底层技术原理上并没有超越第三代,而是改变了训练策略,通过人工筛选,不断判断输出的哪些句子是好的,哪些是低质量的,这样就可以训练得到一个 reward 模型。通过 reward 模型来模拟人类打分的过程,自动对问题的不同回答打分,模型再根据打分调整参数。即用问题、回答和分值作为数据,用强化学习的方式训练模型。这就是Chat GPT可以模拟情景对话、给出多元化答案,并在和人类的对话中可以不断修正结果的原理。
在深入探讨上述生成式AI的工作机制时,我们可以清楚地看到,海量的数据源是AI学习的基础,数据的真实性和合法性则对AI输出的结果产生直接影响,进而关系到版权、隐私以及伦理等方面的问题。同时,AI输出的结果是否具备法律保护的地位,以及是否有可能侵犯他人的权益,这也是AIGC领域法律合规性的核心问题。
//////
二、人工智能生成物是否能够获得《著作权法》保护
在今年的3月份,美国版权局发布了一份针对生成式AI作品版权的政策声明。该声明强调了区分“生成式AI生成的材料”以及“由人类创作(human-authored)和人工智能生成材料(AI-generated material)组成的作品”的重要性。
首先该份声明依然坚持了一项基本原则——版权法只能保护“人”的智力创造。因此,由计算机算法自主创建的生成物是无法被认定为“作品”的。而在今年2月,一份由人类作者创作文本、Midjourney生成图像的图画小说(Zarya of the Dawn),却得到了美国版权局的认可,被认为构成版权法保护的作品,获得了有限的保护。对此,美国版权局进一步解释,该图画小说中人类创作的文本属于人类的智力成果,符合版权法保护的标准,可以单独登记成为作品;而Midjourney生成的图像,仅仅是基于计算机算法得出的材料,无法独立获得保护,但不影响整个图画小说成为一个完整的作品。
那么对于由人类使用生成式AI进行多次调整、修改后的作品是否能够保护呢?
在此问题上,该份声明举例了人类使用Photoshop编辑图像的例子。视觉艺术家利用图像编辑软件修改图片,计算机仅仅是一种辅助工具,它不影响人类对作品表达的创作性控制,因而不会影响图片艺术家的“作者”身份。相反,对于由机器自动运行,没有人类作者的任何创意或干预而产生的作品则无法获得保护。而关于在人工智能训练中使用受版权保护的作品在法律上应当如何规制等问题,美国版权局后续也将向社会公众征求意见。
因此我们看到了一个有意思的现象,美国版权局没有一刀切地认为只要是AI生成的作品就不是“作品”,而是需要进行个案分析。虽然如何判定人类在作品中的智力贡献,以及是否能够在单件作品中独立区分开人类创作部分和AI创作的部分,是一件在实际操作中并不容易的事情。但至少,该份声明明确了,版权法依然应当以人为本,也奠定了生成式AI应当服务于人类,成为人类工具的基调。
而英国在作品的创造性问题方面,则一直主张“额头流汗”原则,即只要作品中存在作者的劳动即可,而无论此项劳动的多少。英国《1988年版权、设计与专利法》明确认可文学、戏剧、音乐或艺术作品如果是由计算机产生的,那么这一作品的作者应当是对该作品的创作进行必要安排的人,此类由计算机生成作品的著作权保护期限系自作品创作完成当年的最后一天起五十年,同时对于此类作品不适用著作人格权。【2】
目前,我国现行出台文件均没有对AI生成物是否符合《著作权》法意义上的作品给出结论性评价。而在国内现有的案例中,对于AI生成的作品是否是“作品”也形成了完全相反的观点。
让我们先回归法条,我国《著作权法》中所称的作品,“是指文学、艺术和科学领域内具有独创性并能以一定形式表现的智力成果”,所以作品具有两个实质构成要件:“独创性”和内容属于“智力成果”。
那么这里的“智力成果”是否必须为人类的智力成果呢?
我们从(2019)粤0305民初14010号“Dreamwrite”案件中可以看出一些判断方向。深圳南山区法院认可了由Dreamwriter软件自动撰写完成的文章可以被认定“作品”,但其在说理部分强调了“Dreamwriter软件的自动运行并非无缘无故或具有自我意识,其自动运行的方式体现了原告的选择,也是由Dreamwriter软件这一技术本身的特性所决定……从涉案文章的生成过程来分析,该文章的表现形式是由原告主创团队相关人员个性化的安排与选择所决定的,其表现形式并非唯一,具有一定的独创性。其观点是,人工智能生成内容基于人工智能的控制人或研发人员设置一定的技术、算法而得,其在一定程度上仍属于人类的智力成果。但同时可见,我国法院在判断AI生成物是否是作品的过程中,仍不可排除地需要甄别“人”在作品中的地位和作用。
然而随着深度学习技术和大数据等网络技术的飞速发展,人工智能早已摆脱了遵循既定算法和程序的计算机辅助工具的地位,能够独立自主创作。这种自主创作的方式将可能使人对作品的控制性创造作用越来越小。因而,笔者认为,美国版权局的甄别方法或对我国AI生成物的保护具有一定的借鉴和参考意义。
当然,我国《著作权法》虽暂无定论,却不妨碍生成式AI的提供者通过与用户订立协议的形式约定生成物的著作权归属。
//////
三、人类如何拥抱生成式AI
生成式AI给人类带来的冲击感毫无疑问是强烈的,甚至对一些职业造成了现实的威胁,比如游戏制图、影视美术、工业设计等领域,AI看上去稍加训练便可以替代,想象力甚至超越人类。但通过上文对AI原理的分析,我们也可以清醒地认识到,AI虽然具备了深度学习的能力,但仍在模拟人类进行思考,也需要通过人类来甄别一些信息。比如文本生成型AI,当我们需要一个专业领域的 LLM 时,用于预训练模型中的知识库就显得尤为重要。由于大多数预训练模型都是在通用训练语料上进行学习的,对于一些类似金融、法律等特殊领域中的概念和名词,AI都无法具备很好的理解。所以需要在训练语料中加入一些领域数据,以帮助模型在指定领域内获得更好的效果。这就给了专业领域的人才以新的合作机遇,而未来,训练完成的AI将可能有针对性地适配在各个专业领域内,成为能提高人类效率的良好工具。
而图片生成式AI的新赛道则展露的更早,美国早已出现了售卖提示词的网站。在AI的世界里,提示词(Prompt)就是和AI沟通语言的桥梁,通过准确的使用关键词,才能让AI生成出自己想要的、具有稳定风格的作品。而那些能让AI做人类想要让他们去做的事情的专家被称为提示词工程师(Prompt Engineer)。
//////
四、我国“提示词”保护的思路的构想
目前国内外,已有很多使用大模型进行生产创作的实践应用,涉及到软件开发、文本处理、图像生成等多个领域,而“如何写出好的提示词”正在成为各个领域热论的议题。接踵而来的,即是优秀的提示词如何能够保护?
我们首先来分析其是否能够通过《著作权法》进行保护?
一些由词组、短句堆砌而成的较为简单的提示词,由于其本身不能联系成为一个语义连贯,具有独创性意义的作品,因而不属于著作权法保护的对象。而如将古诗词“横看成岭侧成峰,远近高低各不同”作为提示词,亦无法获得保护,因为该作品已属于公有领域,同样不符合保护条件。由此来看,提示词想要获得《著作权法》保护,则可能需要进行非常详细的描述,同时又要具备独创性的特征。
如果要求提示词工程师一定要达成上述条件,其智力成果才能获得保护,确实是有些强人所难,更有些强AI所难,因为AI的本质系一系列计算机程序的组合,其善于接受的指令通常应当是简洁、简短、明确的词语或短句,并不需要过多的修饰或完整连贯的意思表示。但一段好的提示词的确需要工程师进行反复的推敲、实验、修改,同时也需要工程师具有一定的计算机软件编程知识或至少应当初步了解其所被提示的AI的基本工作或运作原理,要付出非常极大的努力,不可否认一段优秀的提示词应当被认定是智力成果。
那么在提示词本身的基本表达不能被著作权保护的情况下,是否有更好的保护方式呢?
笔者认为,在没有新的法律法规制定和颁布之前,我们可以在现有知识产权法律法规框架体系中寻找适合的方式,首先,提示词的排列组合方式可以被定义为一种方法,而方法是可以通过发明专利进行保护的,简单以绘画类AI举例,当我们需要使用提示词通过绘画类AI生产作品时,提示词通常至少会包含需要绘画的物品、物品的色调、整体绘画的风格,如包含人物肖像,亦需要人物肖像的特征,人物的情绪定义等,对于这么多关键信息,我们采用不同的排列方式将会得到AI生成的不同表达的作品,例如先体定义总体风格并嵌套色调、先定义情绪再嵌套肖像特征与先定义色调、肖像特征最后定义风格和情绪将获得不同的作品,这种方式即方法如具有一定的新颖性和创造性,是可以尝试申请发明专利并获得发明专利的保护的。当然,通过发明专利保护的劣势也非常明显,即一件发明专利的审查期限至少需要12个月左右,甚至更久,对于提示词规则的生命周期而言,保护是否会滞后可能是需要进一步考量问题;其次,我们来看提示词的本质,即一些具有明确含义的字、词、短语或短句(下文我们称之为“提示词元素”),其中明确的含义一般是指没有歧义,只有准确表达,让AI准确领悟提示人的意图,才能更有效的创作AI生成物(作品),从这一特性我们可以基本断言有效且优秀的提示词元素是有限的,例如可以有效提示肖像的提示词元素是这几个、有效提示情绪的是那几个、有效提示风格的是这一系列、有效提示运动状态是那一系列。这样大家是否想到,或者已经有非常多的企业已经在做的一个工作就是收集并汇总各个领域有效且优秀的提示词元素,并将其分类梳理为数据库,而“数据库”是我国著作权法明确保护得作品客体。所以,即便实际应用的某一段提示词不构成著作权法意义上的作品而不能获得保护,但可以考虑对提示词的分类组合的数据库进行确权和保护,而其关键点可能在于提示词的分类即数据库的字段设置,具体我们将另外行文分析。
AIGC可以说是一项最接近普通人的AI运用,它使得AI不再那么高不可攀,只要一台联网的终端,人人都可以通过向AI发出指令的方式进行创作,并得到AI创作物(AIGC)。AIGC让人们体会到了AI的强大、便捷和效率,即便是在当下生成式AI实际应用发展的初期,其已经能为个人、企业解决非常多棘手的、繁杂的问题,其迅速热门也就不足为奇。由此接踵而来的当然是各种法律问题,无论是AI服务的提供者、AI服务的运用者、AI生成的作品的阅读者都会想要了解自己在提供服务、使用服务、浏览作品时应当符合的法律规范,笔者的系列文章意在通过探讨分析我国以及世界相关法律法规并结合自身通过分析得出一些粗浅结论让大家更好的了解AI相关法律问题,并希望能拓展大家的视野,为大家在AI领域的运用提供灵感。
下一篇文章,我们将着重探讨我国对于生成式AI的态度以及相关管理规定的解读,AI生成物如何避免侵权等问题。
//////
注释:
【1】 《大规模预训练模型》,《中国计算机学会通讯》2021年5月第5期,P8
【2】 [ 唐蕾.人工智能生成物的著作权保护比较法研究——以元宇宙背景为视角[J].电子知识产权,2023,No.376(03):81-90.]
参考文献:
【1】《大规模预训练模型》,《中国计算机学会通讯》2021年5月第5期
【2】《一文读懂ChatGPT模型原理》,JioNLP团队,知乎
【3】ChatGPT的工作原理:机器人背后的模型,36氪,百度
本文内容转自公众号“知产前沿”,2023年7月22日发布《赵婧等 | 生成式人工智能法律法规梳理与实务指引(一)——AI生成物的保护》
本文作者:
上海申浩律师事务所合伙人、专利代理师沈琲律师上海申浩律师事务所赵婧律师上海申浩律师事务所实习生罗赓
本文内容仅代表作者个人观点,依据作者个人对法律、案例以及结合自身经验而形成,不对其准确性做完全的保证,不代表申浩律师事务所的法律意见或对法律的解读。
本文为申浩律师事务所律师原创,版权归署名的作者所有,转载须经作者本人同意。本文可通过微信转发功能全文无修改之转发,不允许通过复制等方式全部或部分的方式于其他账号中的再次发表。
如您需要法律意见或其他专家意见,应当向具有相关资格的专业人士寻求专业的法律帮助。
*
往期回顾:
*火灾事故处理法律服务要点解析 | 律师实务
欢迎通过申浩律所官方微信与申浩官网了解更多信息:
申浩官网:
www.sunhold.com.cn
官方微信:
AI时代,拥有个人微信机器人AI助手!AI时代不落人后!
免费ChatGPT问答,办公、写作、生活好得力助手!
搜索微信号aigc666aigc999或上边扫码,即可拥有个人AI助手!