以人工智能(AI)为驱动的第四次科技浪潮已经来临,正深刻改变千行百业和整个经济社会,并成为国际科技实力竞争的焦点之一。而以ChatGPT为代表的生成式AI大模型,让AI写作变得极为便捷、高效,已经广泛应用于几乎所有需要文本写作的领域。有作家表示,一个勤奋的作家创作一百万字的小说原本需要一年多,现在借助AI工具需要一两个月,以后还可以缩短为一到两周,已经接近阅读这篇小说的时间了。然而,随着AI写作的横空出世与快速发展,关于其权属主体、信息泄露等方面的争议和忧虑也随之而来。
一、AI是不是创作主体
AI能够生成以往没有的新内容,其作用远超传统的写作工具如笔或电脑。因此一些学者和作者认为应当赋予AI创作主体地位,创作主体已经不限于人类了。有的作者甚至在作品署名时加上了AI,认为应该尊重AI的贡献,否则就是窃取其劳动成果。但是,在法律上,AI不具备法律主体地位,也无法独立创作,只能按照人类发出的指令生成文本。AI生成的文本需要人类修改完善后才能交付。
另一种观点认为,应限制AI写作的使用,以维护创作的纯洁性和人类的主体性。在2022年的某些文学竞赛中,明确规定禁止AI参与创作。但很快随着ChatGPT的横空出世,带动一大批大模型推出,包括功能的迅速完善迭代,无数人开始使用AI写作,限制的呼声越来越弱。AI写作可能会像洗衣机、电脑、智能手机一样,逐渐成为人人使用、不可或缺的生产和生活工具。
我们再从创作能力看,AI难以真正理解人类情感和复杂的文化背景,写作质量也高度依赖输入数据的丰富性和多样性,这限制了其在文学创作中的深度和真实性,以及在职场文本写作中契合实际的程度。AI尤其可能生成违反伦理道德甚至违反法律的文本,因此在正式交付使用或发表之前,必须依赖人类作者审核和修改。如果文本中出现了道德或法律问题,责任不应归咎于AI,而应由人类作者承担。
此外,文艺作品的创作需要作者的人生经历和情感体验,很大程度上是感性的过程,而机器是高度理性的。尽管AI能模拟人类情感的抒发,但情感的复杂性导致将其变成数据编码十分困难,AI能模仿和表达的只是皮毛。
因此,只有当AI真正具备情感和欲望时,它才可能独立创作出真正的艺术作品,并为自己争取创作主体地位。但是,那时候,AI甚至可能产生统治地球和人类的想法并付诸实施,其对人类社会的影响将远远超出AI写作的范畴。
二、作品权属如何划分
与上个问题相关,AI参与创作的作品,其版权、著作权、专利等权属应当属于谁呢?首先,AI无法享有知识产权,因为我国法律主体仅包括自然人、法人、非法人组织和国家,只有这四种主体才能享有权利并承担义务,这也是整个法律体系的基石。而AI不是法律上的权利义务主体,也就不能拥有权属。若要赋予AI法律意义上的权利和义务,则必须改变整个法律体系的基石,这将引发一系列连锁反应。
其次,任何权利的获得要么是权利主体自己争取要么有利益代言人。但AI目前只是执行指令,没有诉求,也不会多少人真心想要为AI争取权利。从必要性和可行性来看,为AI赋予权利义务都不是短期的事。除非像科幻小说描述的,AI产生了意识、情感、欲望,要为自己争取权利。
最后,在司法实践中,判断一篇文章或作品是否使用了AI,从AI文本生成的机制、作者的后续修改等角度来看,无论是通过专家鉴别还是技术手段,都难以发现物理痕迹,也无法得出具备法律效力的确定结论。这些内容是采用人类语言、模拟人类思维创建的,笔者认为其与人类创作的作品在本质上没有区别,难以清晰区分。即使我们凭感觉能判断出AI的参与,但很多时候也很难找到实际的“证据”。
还有人认为,如果使用他人的作品和数据训练大模型,或者使用这个大模型生成文本,就要给原作者权属。但这在法律上都未被认可。训练模型的数据来源与授权必须合法,这是另一个法律问题。对于使用这个模型的人而言,就像租用了一台机器去耕作,收获的小麦不需要分给机器所有者,更不需要分配给机器。另外,由于AI生成文本是随机的,即便不同作者使用同一工具输入完全相同的指令,生成的文本也不会完全相同,因此版权纠纷的可能性较低。
因此,在笔者看来,AI生成的作品的权属无争议地归属于使用AI的人类作者。
三、如何解决隐私和保密问题
AI写作需要将数据、文本、指令以及用户信息传输给平台,而平台掌握这些信息后,存在信息安全和隐私泄露的风险。尤其是开放的平台还会遭受互联网的攻击。这就限制了AI写作的应用,有的重要政府部门已经明文禁止使用某些AI工具写作。
从保密角度考虑,自行开发写作大模型,并在对外封闭、对内联通的网络中使用,所有的东西都掌握在手里,无疑是最安全的。
但是了解AI写作原理的人都知道,开发一个写作大模型的成本非常高。由于写作涉及的领域十分广泛,即便是一份报告或一部小说,也可能跨越多个行业和领域,因此训练、运营、维护大模型的成本非常高。类似于ChatGPT的大模型,需要海量的数据、算力、存储,还有运算的基座,基本是百亿人民币起步。ChatGPT训练用的数据就是整个互联网上所有数据,涵盖了人类几千年历史积累的知识、信息。因此,训练这样的大模型只有极少数实力雄厚的大型机构才有可能完成。当然,利用免费的开源数据进行二次修改可以大幅降低成本,但正如有人所说,“免费的往往是最贵的”,你无法要求数据提供者提供个性化服务,也无法知道其中是否隐藏了潜在的风险。
将已有的AI写作平台作私有化部署,实现与互联网的物理隔绝也是一种不错的选择。在局域网内部署高水平的写作大模型,其成本在千万人民币级别,大型企业和政府机构已经具备承受能力。只不过你至少要有一个封闭的内网,并且有这个需求,愿意花这笔钱。可惜的是,最先破局并且笔者认为使用体验较好的ChatGPT4,还没有开放私有化部署。
那么军队、政府部门这种安全诉求大于效率诉求的机构,可以自主开发大模型并做内部部署。关乎国计民生的金融、能源、交通等领域也可以这么做。其他大型机构可以在内部部署现成的AI写作平台,成本低很多,安全性也会差一些。包括作家在内占绝大多数的散户写作者,使用大模型服务商的服务是最佳选择。这需要将指令传到外部云端,在云端运算完再把结果传回来,隐私和保密就难以保障了。当然这也可以通过不断完善立法和执法予以规范,现阶段个人作者在使用AI写作时应具备保密意识,避免将需要保密的信息传给大模型。
总之,从科技发展的趋势来看,AI的作用将日益增强,这一趋势不可阻挡。随着AI功能的完善和应用的扩展,越来越多的人将在更多领域使用AI写作,这也将引发更多的争议和问题。甚至可能会出现一个新的奇点,颠覆我们现有的认知。AI必将在争议中迅速前行,因此,拥抱AI、善用AI、完善AI,是我们必须面对和实践的课题。
(蔡啸系北京作家协会会员、湖南大学行业产业研究生导师,吴娜系中国移动研究院AI中心主任研究员、高级工程师)