年底,各出版社杂志社纷纷推出了以自己评判标准为基础的文学榜单,仅以《收获》杂志主办的“收获文学榜”和《扬子江评论》主办的文学榜为例,2019年重复的篇目还是相当不少的,这大概与评选人的审美趋同有一定关系。既然现实生活中充满了各种打分制的评价体系,为什么不让AI来试试?所以,文学的审美究竟有没有可能借助人工智能量化?
技术层面而言,是可以的。比如,在语言上,固然不能说出王安忆和迟子建的句子孰好孰坏,但和谐之美还是有尺度的。美学上的黄金分割比例,应用到文学作品上,其实是句子内在气息的调和:全部都是长句,或者全部都是短句;大量运用感叹号的情绪四溢,还是从头至尾平和到淡漠的句号逗号;大量直接引语形式的割裂性传统对话,还是通篇法国新小说式的对话全部融入环境、场景,随意切断,显示某种做出来的真实感……内在的各种组合搭配,一来可以通过全文词频统计方式将文学风格计量化,二来可以将经典作品建立模型,进行比对。
2017年底,我离开工作了14年的《收获》杂志社,自己创业。我想做一款软件,能对文学进行评估,尝试着把文学评判从主观定性变成客观定量。为了达到这个目的,软件开发过程中,结合了面部表情分析(愉快、悲伤、厌恶、愤怒等)、深度神经网络算法、心理学、语言学和计算机学等诸多学科知识,通过量化手段来研究文学的规律。
一方面,软件可以对某种纯客观的审美观察并进行量化,另一方面,它也可以对读者审美反应或审美评价进行量化,最后形成美学量化原则,指导功利意义上的审美创造。
机器的深度学习,它看见的其实是所有艺术中蕴含的数学原理,生活的绝大多数都可以被量化,那么文学之美,为什么不能被量化呢?库尔特·冯内古特于1965年向芝加哥大学提交了一篇分析《灰姑娘》等经典故事基本套路的论文。为了分析《灰姑娘》的情感曲线,他自制了一个图表,X轴代表故事的时间轴,Y轴则代表故事的主人公经历的好运和厄运。最终,《灰姑娘》图表上的曲线成阶梯状上下起伏。“亚当与夏娃的故事,它的曲线简直就是《灰姑娘》的镜面反射。”不过,这篇论文当时因为样本有限被学校拒绝了。但这倒启发了我。
经过研究后,我发现,所有文学作品,基本逃不出9种曲线。以2018年3月29日发布的“中国网络文学20年20部优秀作品”为例,经过分析研究,有四种曲线,以《致我们终将逝去的青春》为代表的W型;以《悟空传》为代表的N型;以《盘龙》为代表的V型;以《神墓》为代表的M型;以《明朝那些事儿》为代表的倒N型。由于榜单中缺乏其他四种曲线,我选择起点中文网其他打榜完结网文进行补充,还存在倒V型、接近于一型、爽文/一路向上型、丧文/一路向下型等。
2019年我和《思南文学选刊》合作,让“一叶故事荟”为20本文学杂志2018年刊发的全部771部短篇小说打分,先从各家杂志中挑选出3篇作品,再进行综合排名。首先从最基本的情节入手,情节的起伏经过快速傅立叶变换处理,整体呈现出一定的周期性特征。这个周期性特征,也许就是霍金一直寻找的万物理论:一个统一的、简单的、优美的公式。AI评价小说的标准——在软件这里,正是这个公式的优美度,即小说叙事曲线的优美度。其他分析的维度还包括小说的主题、情节、人物,以及有关小说风格和设置的各种变量。
截至2019年1月20日,它的最爱读物始终是莫言的《等待摩西》。1月21日周一下午2:53,副主编黄德海又要来了参与此次评选的最后两本杂志《鸭绿江》和《小说界》,新增80部短篇小说。晚上7:20,有趣的事情发生了。它最终选出的年度短篇是陈楸帆发表于《小说界》的《出神状态》。出于好奇,我打开了这篇小说。小说结尾有这样一个注:带*号楷体字部分为AI程序通过深度学习作者风格创作而成,未经人工修改。
一个AI何以从771部小说中,准确指认出另一个AI的身影?这是我未曾意料到的,看来AI的评判体系里,一样也有“机情世故”的考量。
AI的学习方式与大脑类似,即通过例子来学习,然后使用概率模型来解决问题。也许这不再是算法的问题,而是一个预测的问题。这本杂志下一部即将刊登的小说将会符合怎样的特征,才能让它融入这本杂志?这种预测的准确性自然需要大量的学习而改进。
后来我们又合作了中篇榜。评选中篇榜时,算法工程师团队使用了影视改编适合度的曲线判断算法,对2018年全国16本文学杂志共236部中篇进行了扫读,每本杂志选出一篇最高分作品,再进行整体排序,得分最高的是发表于《大家》第3期凌岚的《冰》。经过分析后发现中篇里W型故事占绝对主导。W型一定是个结尾有所光明指向的故事,故事初期主角略有被动,但结局会乐观暖人心。情节在全文尺度上起伏均匀对称,节奏感强。曲线类型或许和故事题材关系不大。
究竟是什么决定了曲线的不同?故事驱动元素不同,则曲线走向不同。在主线为爱情元素的故事中,N型常表现为有情人终有所得。以爱情故事为例,N型表现“男女主角见面相爱——战胜困难——最终走到一起”,人物最终会走向成熟。而“历经重重困难,终于领悟到生活的意义和爱情的真谛,勇敢追寻自己的内心,寻回真爱,收获爱与信仰”,也符合N型叙事规律。
倒N型则往往蕴含了主角的重生性,但这种重生需要付出极大的代价,往往用来塑造带有悲剧气质的英雄人物形象。一个满身创伤的人物,固然取得了最后的胜利,这样的胜利带来的成就感却让人一点都自豪不起来。
如果说W型往往以团圆结束,M型则经常以悲剧收尾。M型简而言之就是“求之而不得”。青春叙事里这样的故事很多,写的往往是一场少年人生的求不得与放不下。V型叙事的精妙在于线性联系的阻碍一层复一层,当然,最终是邪不压正。至于倒V,其实就是翻越大山回到起点,这种叙事模型往往蕴含着主角对外部世界内心世界的探险。
在上述16本刊物中,《天涯》《青年作家》《野草》《延河》的叙事走向更为沉郁。
2019年8月16日第十届茅盾文学奖揭晓,5部作品获奖。8月17日我发了个朋友圈,贴出5部得奖作品的情节曲线,并坦言:其中影视改编系数最高的是《主角》(0.7934,满分为1),其次是《人世间》(0.7611)。“这两部肯定已经卖出影视版权”,后来从朋友处证实,《主角》系张艺谋团队购买,《人世间》系腾讯影业购买。
接下来,这样的探索还会继续。人类和机器都有缺点,而人机合作最大的好处是节省时间,能克服人类在速度、注意力、先入为主、自身喜好等方面的局限。与此同时,人类也面临着人工智能机器带来的巨大挑战,比如如何认识人类在这些判断之下的位置,如何在AI高速发展的时候提高自身的竞争力,如何理解甚至参与创造AI的写作伦理……
事实上,如果评委们愿意,我们完全可以尝试一下这样一个阅读榜:每个评委在阅读小说时允许摄像头实时录下自己的表情,计算机可分析出每位评委在阅读故事时的情绪起伏,由此判定究竟是哪些小说真正打动了他们。是的,真正打动。如果文学离开了人类真实的情感,再多的榜又有何意义呢?