清华大学金融科技研究院孵化
金融科技与金融创新全媒体

扫描分享

本文共字,预计阅读时间

2022年11月30日OpenAI发布ChatGPT 3.0,为人们提供了一个全新交互方式和工具,标志着自然语言处理领域的一个重要里程碑,同时也在世界范围内不断促使人们深入思考人工智能在社会生活中的影响。

我国《生成式人工智能服务管理暂行办法》所规范的生成式人工智能技术,是指具有文本、图片、音频、视频等内容生成能力的模型及相关技术。通用生成式人工智能服务,我们认为从性质上属于公共产品,功能上属于数据信息处理工具,使用通用人工智能服务所生成内容属于用户素材,使用者可基于生成内容进行再创作形成作品而享有著作权

需要注意的是,我们此处仅讨论生成式人工智能服务生成内容的法律性质,其他类型人工智能技术服务生成内容可能具有不同技术机理和不同应用场景,结论可能不一定适用,需要另行讨论。

一、通用生成式人工智能服务性质上是提供公共产品

公共产品是指在消费上具有非竞争性和非排他性的产品或服务,具有满足社会共同需要、实现社会公益与公平的重要意义。非竞争性是指一个人对公共产品的消费不会影响其他人对该产品的消费,非排他性是公共产品原则上向全体社会公众提供。通常,政府通过税收或其他方式为公共产品筹集资金提供支持以满足社会的共同需求。

随着数字经济发展,出现了一些与传统社会公共产品如基础设施、教育、医疗保健、公共安全、环境保护、文化体育、行政服务不同,而具有数字时代特色的公共产品或服务,如高速互联网、无线网络、数据中心等数字基础设施;公共在线教育平台、开放教育资源、电子书籍等数字教育资源;电子病历、远程医疗、健康监测应用等数字健康服务;政府、研究机构或其他组织提供的公开数据集;实时公交信息、智能交通系统、共享单车等数字交通服务;通过传感器和数据分析技术,实时监测空气质量、水质等环境指标等数字环境管理;数字化文化遗产、图书馆、档案馆等数字文化资源;政府提供的电子注册、电子纳税、电子签证等数字政务服务

通用生成式人工智能服务应当被视为一种公共产品,应当具有非竞争性和非排他性,主要原因如下。

一是服务提供具有公共性,从训练数据来源看,生成式人工智能服务所用的训练数据从根本上来自全社会提供;从算法模型看,其生成内容匹配逻辑是根据法律法规要求、社会惯例或共识,即其逻辑具有社会性;从输出结果看,使用者所输入提示词虽然是个人贡献且都可以产生相应结果,但其输出结果却是相对有限且在相对稳定条件下具有特定性;从使用者权益看,本质上通用人工智能服务模型、输出结果的法律责任承担者是开发者和运营者,使用者权益来自运营者赋予,且相关责任从根本上说由运营者承担。

二是服务使用具有公共性。《生成式人工智能服务管理暂行办法》规定鼓励生成式人工智能技术在各行业、各领域的创新应用,生成积极健康、向上向善的优质内容,探索优化应用场景,构建应用生态体系。”一方面,通用生成式人工智能服务可以为广大使用者提供内容处理相关支持,生成式语言模型所用的众多数据可以说是社会性的,参与面是全社会的,模型逻辑反映了整个社会层面的共同需求,无论是普通用户还是企业、组织,都可以从这些模型中受益,获得语言生成、问答、翻译等方面的服务;另一方面,只有社会公众越广泛越频繁参与,才使得通用生成式人工智能服务越能贴近社会生活和人们需求,社会广泛深入有质量参与是生成式人工智能服务应用发展不可缺少的条件。

三是服务支持具有公共性。通用生成式人工智能服务所需要的算力、存储、训练数据芯片、软件、工具、算力和数据资源,需要政府集中相关社会性资源有效支持,正因为如此,《生成式人工智能服务管理暂行办法》特别规定,“推动生成式人工智能基础设施和公共训练数据资源平台建设。促进算力资源协同共享,提升算力资源利用效能。推动公共数据分类分级有序开放,扩展高质量的公共训练数据资源。鼓励采用安全可信的芯片、软件、工具、算力和数据资源”,“支持行业组织、企业、教育和科研机构、公共文化机构、有关专业机构等在生成式人工智能技术创新、数据资源建设、转化应用、风险防范等方面开展协作。”

即使这些资源可以由某一特定商业主体支持而提供,也不宜将其服务过分商业化而导致失去公共性,在人工智能发展越来越呈现更深入更广泛更宽领域影响社会生活的趋势下,保持通用生成式人工智服务的普惠性和公平性,将可能是需要上升到保障人的基本权利的层面,足以影响社会公平和可持续发展。也可能正是这个原因,《生成式人工智能服务管理暂行办法》也规定,“鼓励生成式人工智能算法、框架、芯片及配套软件平台等基础技术的自主创新”。

未来随着人工智能迅猛发展,除了生成式语言模型,还将出现具有人工智能应用相关的其他数字公共产品,如智能框架和工具人工智能云服务开源模型和预训练模型人工智能教育和培训资源,智能数字图书馆和知识库等等。

二、生成式人工智能服务功能是提供内容生成

生成式人工智能服务提供自然语言处理和文本生成功能,它根据用户给定的输入或提示自动生成各种类型内容,如文章、故事、对话、摘要等,甚至还可以视频、图像等多模态形式呈现。它能够根据给定的主题、关键词或模板,自动创作出连贯、有逻辑的内容。就目前而言,通用型生成式语言模型输出结果是基于其训练数据和算法的推断,存在一定的局限性和不准确性。在实际应用中,仍然需要结合人类的判断力和专业知识进行进一步的评估和修正,我们以OpenAI提供的生成式人工智能服务为例说明其功能的特征。

OpenAI是最具代表性的生成式人工智能服务,我们结合OpenAI服务协议用户协议等相关信息分析,其具有以下几个特征。

一是OpenAI并不保证内容准确性。根据其相关条款,OpenAI App不对任何内容、代码或任何其他不精确之处负责;AI应用程序不提供保证或担保。公司保留随时对服务内容进行添加、删除或修改的权利,恕不另行通知;服务及其内容是“按原样(as is)”和“可用(available)”提供的,没有任何明示或暗示的担保或陈述;人工智能应用程序在不限制上述规定的情况下,AI App或其任何附属公司、员工、高管、董事、代理人等提供的任何口头建议或书面信息均不构成担保。价格和供应信息如有更改,恕不另行通知。在不限制上述规定的情况下,AI App不保证AI App服务不间断、不受破坏、及时或无错误。

二是OpenAI是提供内容而非创作内容。根据其相关条款,AI App是第三方提供的内容的分销商,而非出版商;因此,人工智能应用不对此类内容行使编辑控制权,也不对通过人工智能应用服务提供或可访问的任何信息、内容、服务或商品的准确性、可靠性或流转传播性作出任何保证或陈述;人工智能应用程序明确否认在人工智能应用服务上或与之相关的任何内容中传输的所有保证和声明,或在可能作为人工智能应用软件服务链接出现的网站上传输的任何内容,或在作为人工智能软件服务的一部分或以其他方式与人工智能软件应用软件服务相关的产品中传输的任何担保和声明,包括但不限于任何适销性保证,适用于特定目的或不侵犯第三方权利;

三是OpenAI使用者权利来自运营者授予使用者对于生成内容享有的权利取决于软件使用协议以及相关法律法规的规定。使用者有权使用生成的内容,但需要遵守软件使用协议以及相关法律法规的规定。在使用生成内容时,使用者需要了解并遵守软件的版权声明和使用协议,以确保自己的使用行为合法合规。同时,使用者也需要尊重OpenAI创作者权益,不要侵犯其版权和知识产权。在某些情况下,软件使用协议可能会规定使用者拥有对OpenAI生成内容的某些权利,例如复制、修改、发行等权利。使用者应该仔细阅读软件使用协议,了解自己的权利和义务。此外,如果OpenAI生成作品涉及个人隐私、肖像权等问题,使用者也需要尊重相关法律法规的规定,避免侵犯他人合法权益。

三、通用生成式人工智能服务生成内容是用户素材而非作品

从以上分析可以看出,通用生成式人工智能服务是内容生成工具,因其本身并不提供内容准确性保证,其自我定位是内容分销而非出版,用户权利来自其授予。生成式语言模型是创作工具,对创作起辅助作用,用户通过输入提示词智力投入,所生成的内容并不具有排他性,从著作权角度而言并不具有独创性。用户使用语言模型的智力投入从本质上而言,是借助语言模型,挑选得到相应的创作素材,而这种素材并非独占性,是社会公共产品。

我们从著作权法角度,进一步分析用户使用生成式语言模型生成内容是否构成作品,其使用本身是否是创作过程本身。根据我国著作权法规定及相关司法实践,判断使用者所生成内容是否有著作权核心包括是否智力成果和是否具有独创性。

从内容形式上,使用者所生成内容并不具有独创性。从上述对OpenAI生成内容的过程分析可以看到,在通用生成式人工智能服务中,在相对稳定条件下,其生成内容是可以复现的,即不同的使用者在使用相同的服务时,输入相同提示词以及相同SEED(等相关参数)的情况下,可以重新生成相同内容。也就是说,利用AI大模型生成内容属于机械创作。任何使用者都可以在相同环境下复现同一图片,该内容不应认为是作品。

也就是说,AI模型本身生成内容只能认为是素材而不是作品,素材是大家都能用,即单纯AI生成内容不构成作品。我们这里所称的单纯AI生成内容,即使用者在使用通用型人工智能服务时,仅通过输入提示词后生成内容,使用者未再做任何加工处理。这类内容之所以不应有著作权,是因为任何人输入相应提示词都可能会生成相关内容,本质上不具有独创性。

从生成过程上,使用者生成内容中所使用智力是用于挑选而非创作。人工智能生成内容是随机生成过程,不同人类创作过程。人工智能生成作品的原理并非对素材进行理解后和人类创作原理一样进行创作,而是利用素材和算法,进行大量随机生成。

人工智能通过提示词生成内容的过程不能视为创作。用户不能预测和控制人工智能生成内容的结果,仅仅是对生成内容进行筛选。用户通过输入提示词,并且修改提示词来生成内容,实质上属于“抽奖”而不属于自主形成内容。用户利用不同提示词对生成内容的影响并不知情,用户仅仅是通过生成大量图片后进行筛选,对内容生成并没有控制能力。和人类创造表达的过程的区别。

在北京互联网法院审结的“AI文生图著作权案”中,法院认为,

从涉案图片的外观上来看,其与通常人们见到的照片、绘画无异,显然属于艺术领域,具有一定的表现形式。涉案图片系原告利用生成式人工智能技术生成的,从原告构思涉案图片起,到最终选定涉案图片止,原告进行了一定的智力投入,比如设计人物的呈现方式、选择提示词、安排提示词的顺序、设置相关的参数、选定哪个图片符合预期等。涉案图片体现了原告的智力投入,因此涉案图片具备“智力成果”要件。

但事实上,其他使用者输入同样的提示词,同样设置迭代步数、图片高度、提示词引导系数以及同样参数种子,都能生成同样的图片内容,当然其他人不一定会选择认可此图片,因此该图使用者对该生成图片智力成果只在于挑选,而不在于创作。

从生成结果上,对生成内容进行著作权保护有失公平。由于在相同环境下不同使用者所生成内容具有相同或相似性,如果对此基于著作权进行保护,则会限制其他使用者用于创造社会财富的机会,这是不公平的,与全社会通过训练数据、算力资源、模型优化等支持通用人工智能服务这一公共特性不相匹配。

四、用户使用通用生成式人工智能服务生成内容再创作形成作品

创作始于灵感的涌现和创意的生成。创作过程是一个复杂而多维的过程,它涉及多个方面的思考和行动。从逻辑上说,首先需要有个目标和方向、进行规划和构思、写作草稿和初稿、进行修订和编辑、反馈和建议等。

用户在使用人工智能服务作为辅助创作工具时,在明确需求的基础上,选择适合自身的大语言工具,使用者利用这些提示功能来通过提供高质量、清晰、准确、有结构的输入,如用户可以提供关键词、主题或段落开头等,可能还需要经过多次调整以引导大语言模型生成符合要求的输出包括生成完整的文章或对话。用户需要对生成的输出内容基础上,再进行检查和修改以确保其符合自身表达准确性和可读性;另外还要注意内容合法性、尊重隐私和伦理问题,如果生成不道德或有害的内容则及时处理以使其服务于自己的创作。通用人工智能服务使用的素材库一般来自合法获得的公开信息数据,生成内容属于公有产品并不会影响人工智能技术发展,使用者基于生成内容进行二次创作后形成的新作品,如属于作者付出智力劳力独立创作,其表现形式具有独创性,应该保护其著作权

当然,在人工智能技术迅猛发展的时代,人们基于生成式人工智能技术进行再创作将成为普遍形态,而且可以预见未来将会出现智能修图、智能排版、智能搜索等许多新兴智能化创作工具协助用户创作,因此其创作成果确认、保护、应用和流转也必将需要通过智能化技术实现,如利用区块链技术去中心化、不可篡改和安全可信特点,记录包括版权所有者、使用权限、交易历史等相关信息,防止盗版和侵权行为;将交易规则编写成智能合约,通过区块链进行自动化执行,确保交易的公平性和准确性,减少人工干预和纠纷;进一步集成开发类似数字版权管理系统对数字版权授权、计费、跟踪和监控,实现包括按使用次数计费、按时间计费等精细化管理;利用人工智能和大数据分析技术,对版权市场进行分析和预测,发现潜在的版权需求和市场趋势,为版权所有者提供决策支持等。

作 者:张烽,万商天勤律师事务所合伙人,万商天勤数字法律专业委员会主任,上海市突出贡献专家协会知识产权专业委员会副秘书长,上海政法学院环境资源与能源法研究中心客座教授和兼职硕士生导师,上海区块链技术协会智库专家/科技评价专家,中国移动通信联合会元宇宙产业工作委员会常务委员,未来产业元宇宙50人论坛副理事长。

张佳霖,万商天勤律师事务所律师。

【数据资产化实践与合规】数字治理研究/万商天勤团队目前与柚子工道等技术、合规、资产评估、会计等合作伙伴一起,组成可信数据服务生态联盟,开发了包括“数据资产化概述”“数据产品设计”“数据资产化相关政策解读”“数据合规评估”“数据交易”“数据资产入表案例解析”等相关课程,并与新华网与上海文化产权交易所发起的“新华数联”数据资产管理平台合作提供数据资产化操作服务,并欢迎咨询。

[Source]

本文系未央网专栏作者发表,属作者个人观点,不代表网站观点,未经许可严禁转载,违者必究!首图来自图虫创意。

本文为作者授权未央网发表,属作者个人观点,不代表网站观点,未经许可严禁转载,违者必究!首图来自图虫创意。

本文版权归原作者所有,如有侵权,请联系删除。首图来自图虫创意。

评论


猜你喜欢

扫描二维码或搜索微信号“iweiyangx”
关注未央网官方微信公众号,获取互联网金融领域前沿资讯。