第8版:新力量

AI绘画:艺术家还是剽窃者?

■刘翁婳

2022年8月,号称“最强绘画AI”的Stable Diffusion模型正式开源,这意味着每个人都可以合法下载Stable Diffusion的模型,并在自己的设备上运行AI图片生成模型,输入指令并生成对应图片。自Stable Diffusion开源以来,围绕AI图片生成产生了诸多讨论。对于AI绘画,我们能看见截然不同的评价,有人说它是人工智能拥有艺术思维的证明,是妙笔生花的艺术家,也有人说它是无耻的剽窃者,通过拼贴已有艺术家的作品生成图片。这些精巧的生成图片也让各国的版权局犯了难:AI生成的图片是否拥有版权?

在解答这些问题之前,我们或许得从AI生成图片的原理聊起:0与1组成的计算机,是如何“学会艺术”的?

要理解AI生成图片的逻辑,首先需要理解计算机如何读懂图片。我们在网络上接触到的大部分照片与插图,大多是以位映射格式储存的,即将图像分为无数像素点,最后转化为数组形式储存。不过,要想让计算机真正“理解”图片却很难:不管是一张草地上的小狗照片,还是毕加索的抽象派画作,在计算机看来都不过是一连串的数字而已。究竟该怎么让它明白小狗与抽象画作的区别呢?

一般来说,如果想要教会计算机做一件事,就需要为它设计对应的规律。例如要教会计算机1+1=2,就要先告诉它加号代表了什么,如何进行十进制的加法运算。但很明显,我们没法清晰地总结出一个规律,告诉计算机怎样的图片才算是小狗。人类的视觉辨别能力与我们大脑中的经验与记忆密不可分,很难用简单的逻辑语言去总结一个客观的判断标准。这就轮到人工智能技术出场了。通过输入大量图片与对应描述以进行深度学习,不断完善现有规则,人工智能研究公司OpenAI最后完成了CLIP(Contrastive Language-Image Pre-training)的开发,即“基于文本-图像的预训练模型”。在训练CLIP的过程中,OpenAI收集了4亿个与文本对应的图像,耗费大量算力资源,才在2021年1月完成了对CLIP的训练并正式公开。借助CLIP模型,我们成功“教会”了AI如何将图像转化为描述性的文字。

生成式AI则是反向的CLIP,它需要研究如何将一个单词转化为一张图片,即“文生图”。显然,比起辨认画面内容,如何让AI自由绘画带来了更大的挑战,也就需要更多的学习资源与算力。这让生成式AI模型的训练曾一度陷入僵局,直到Diffusion改良算法的出现,为图片生成带来了希望的曙光。

借助Diffusion算法,Midjourney、DALL-E等模型在2022年陆续问世。最早的几个模型尚不能正常绘制对称的人脸,但技术更迭的速度日新月异,短短几个月间,主流的AI绘画模型陆续克服了人脸问题,在图片生成的水平上也愈发令人咋舌。当绘画模型Stable Diffusion发布时,观众甚至很难分辨AI生成图片与真人绘画之间的区别。

在这些令人惊叹的AI背后,投入的是大量的算力与训练图片。据Stable Diffusion的创始人Emad Mostacque称,Stable Diffusion的学习数据来源于从互联网上抓取的100000GB图片。Emad Mostacque自豪地将Stable Diffusion称作“生成式搜索引擎”,用他的话来说,图片搜索引擎搜索到的是已经存在的图片,而Stable Diffusion可以生成你能想象到的任何内容。

但Emad Mostacque的说法却暴露了Stable Diffusion最大的安全隐患。与图片搜索不同,在AI生成图片的过程中,丢失了一个重要信息:作者身份。在AI生成的一张图中,分别参考了哪些画家的作品?从AI生成的原理来看,这个问题很难得到解答。此外,这些在网络上抓取获得的图片训练集,也存在版权方面的隐患。诚然,我们若是观看一幅画作,学习研究其中的画法,并不需要为图片付钱,但将如果是将图片作为训练集呢?艺术家与摄影家们往往只有在看见与自己的风格类似的图片生成结果后,才会后知后觉地意识到自己也成为了AI“学习”的对象,但这件事也已无从考证——毕竟不管是哪一种AI模型,都没有公开自己的训练集,即便是开源的Stable Diffusion,也只公布了训练后的模型结果。除了开发者,没人能知道他们使用了哪些图片资源,又侵犯了哪些人的利益。对于这些图片资源的创作者而言,维权之路难于登天。

如果说被用作训练集还能当是“吃了哑巴亏”,对于创作者而言,更直观的担忧则来源于潜在的失业危机。客观来说,AI绘画已经可以快速批量生成图标、建筑等游戏中的基础2D素材,原先负责绘制这部分素材的游戏美术无疑遭到了最直接的威胁。“有了AI绘画技术就可以解雇游戏美术”的传言在人群间流传,尽管没有人能拿出确凿的证据,却有不少美术信誓旦旦地声称,业内已经有公司“借助绘画AI替代外包公司”,甚至于辞退游戏美术。无论这些令从业者倍感不安的传言是真是假,据悉,确实已有不少游戏公司开始使用AI辅助作图。尽管目前的AI绘画仍存在版权上的隐患,但只要对画面中不合理的部分进行二次修改,即便是业内人士也很难分辨人工绘画与AI绘画之间的区别。换言之,即便使用了AI绘画技术,消费者也很难知情。

这种做法逐渐催生了消费者的不信任,有不少游戏玩家仍旧不能接受AI绘画,将使用AI绘画技术视作“不用心”的表现。为了维护自身权利,他们尝试分析图片中的细节,寻找AI的蛛丝马迹,这无疑带来了严重的信任危机。有的游戏因为使用了AI绘画而遭到玩家攻击,也有未曾使用AI绘画的游戏美术遭到玩家质疑,不得不借助展示作品图层、录制视频等方式自证清白。

与此同时,版权法也遭遇了进一步的挑战。随着Controlnet等AI绘画插件的出现,绘画AI现在可以分析某一幅画作的深度图,借助深度图生成相同景深、造型的画作。这种做法是否应当被判定为抄袭?目前来说,我们的法律条款尚不能有效管理、规制这种行为。而在版权方面,各国版权局提供的说法亦是众说纷纭。对于AI绘画是否能够拥有版权,各个国家的版权局做出了截然不同的判断:2021年8月,在澳大利亚,法院裁决人工智能可以作为发明者申请专利,而在2020年9月,欧洲专利局驳回了一位“AI申请人”的要求。2022年到2023年期间,美国版权局多次拒绝了AI绘画作品申请版权的要求,根据官方说法,AI绘画作品不能证明人类作者对作品进行了充分的创作性投入,所以“缺乏维持版权所需的人类作者身份”,无法申请版权。

但在2023年初,漫画《黎明的查莉娅》(Zarya of the Dawn)给美国版权局出了个难题。艺术家Kristina Kashtanova在AI绘画工具Midjourney中,借助关键词与描述,生成自己想要的图片素材,再将它们按照漫画的方式拼接在一起,最后配上台词,造就了一部AI绘画与人类“共同创作”的漫画作品。很明显,人类作者在漫画创作的过程中起到了重要作用,美国版权局很难以“不能证明作者对作品进行了充分的创作性投入”作为拒绝的理由。对此,美国版权局决定将作品分为两部分看待:艺术家获得了“文字、视觉元素的协调和编排部分”的版权,但并不保护由AI绘画工具Midjourney生成的图片版权。换言之,美国版权局依旧不打算承认AI绘画拥有版权,这也为反对滥用AI绘画技术的艺术家们提供了新的支持。

AI绘画之外,人工智能语言模型ChatGPT4的发布近一段时间以来也掀起了不小的波澜。如今,ChatGPT的应答准确度日益攀升,AI绘画的精细化调整与模型训练也在不断发展。逐渐完善的生成式AI将走向何方?究竟是会为人类减负,还是成为人类岗位的竞争者?在技术飞跃的当下,没有人能够妄下定论。但有一件事是不变的:技术,应当服务于人。

2023-04-24 ■刘翁婳 1 1 文艺报 content69722.html 1 AI绘画:艺术家还是剽窃者?