2025年,语言学家朱德熙一段写于40多年前的文字,被选入了高考语文全国二卷的语言文字应用部分的试题。这段文字出自他对报纸文章《微小的敌人:灰尘》的评改,文中有一句“对灰尘之类的小东西,常常是不以为然的”,朱德熙认为,这是把“不以为然”误认为是“不在乎”了。“不以为然”的“然”是“对”的意思,这个词应该表示“不认为是对的”,跟“不在乎”是两码事。接着他写了这样一段话,成为高考考题的核心:
“有人说,语言是不断演变的。今天认为是不合法的用法,等到用的人多了,慢慢就变成合法的了。所以我们最好不要去反对它。这种理论是似是而非的。因为采取这种态度,我们势必对于语言里所有新出现的不合习惯的说法都一概承认是合法的,那么我们的语言还有什么规范和标准可言呢?只有当一种说法得到社会普遍承认之后,我们才能承认它的合法性。这就是语言学家的态度。从这一点看来,语言学家是非常‘势利眼’的。”
考题公开后,讨论随之而来。有人认为,这道题“不偏不怪”,是对语言文字规范意识的一次鲜明倡导;也有人质疑,语言本就是在使用中不断变化的,“约定俗成”是语言的基本规律,凭什么由语言学家来当“守门人”?类似的争议本身并不新鲜。从“说服”读shuō还是读shuì,到“的、地、得”的用法不同,再到网络热词、烂梗对语言的冲击,近年来互联网上围绕汉语语言规范现象的讨论层出不穷,时常引起民众的广泛关注和激烈争论。但把朱德熙的话放在“人工智能未来已来”的语境里,就别有意味了。
40多年前,朱德熙写下这段话时尚没有互联网和社交媒体,更没有今天的大语言模型。那一代的中国语言学家肩负着一项任务:实现汉语的规范化。朱德熙对“不以为然”的较真,吕叔湘对现代汉语八百词的辨析,周有光对汉语拼音“三原则”和“三不是”的坚持等工作的背后,是对“建立规范”这一使命的自觉承担。
今天,现代汉语的基础性规范体系已然建立。然而,我们却面临着一个全新的局面:一个非人的语言生产者悄然登场。大语言模型正在以前所未有的规模和速度生产汉语文本,而它的“语感”,来自对海量文本数据的统计学习。人们对语言的误用,会被老师纠正,被语言规范;但在模型的训练过程中,它可能只是一个概率分布的微小偏移——没有预警,也没有人为此负责。
这意味着,我们对待语言规范的态度需要经历一次辩证的调整。当语言规范体系已相对完善,而AI作为一个缺乏约束的语言生产者出现时,我们面临的矛盾已经发生了变化:不再是“如何建立语言规范”,而是“如何在一个人机共存的语言生态中维护规范的效力”。语言当然需要变化,也无时无刻不在发生着变化,变化本身就是活力的证明。但是,这种变化不应被算法的统计分布所裹挟。因此,我们需要重新思考语言规范的意义。
而这,正是朱德熙的评语在AI时代获得新意义的原因。他反对的不是语言变化本身,而是那种“因为有人用所以就应该承认”的放任态度。他要求在“有人用”和“承认其合法性”之间有一个“社会普遍承认”的环节,有一个观察、判断的过程。这个过程在过去是由人来完成的:老师指导、编辑把关、读者听者反馈。或者说,这是一个需要语言使用者集体“跟风”的过程。但AI不会脸红,不会犹豫,不会在写完一个句子之后觉得不安而删掉重写。它只是按照概率输出,无形中影响、塑造着人们的语言习惯。
先让我们来一起看看AI生成的文本到底有什么问题。
一位初中生说,用AI帮自己写作文,虽然AI用了很多高级的、自己不会用的词汇和表述,但是读起来,好像让人感受不到文章的气息、温度和韵律,在文章中找不到“我”。一个“找不到‘我’”道出了问题的核心。当流通的文本大多是这样被AI生产出来的,语言还能保持它的精确性和表现力吗?
问题还不止于此。相关研究发现,GPT-4o等模型的中文词表污染高达46.6%。这些模型在处理中文污染词时“不能理解甚至不能重复”,输入一个污染词有时会输出另一个污染词。这意味着,AI不仅可能用错表达,还可能在你不知情的情况下,把错误扩散和固化。更麻烦的是,当越来越多的人使用AI生成文本,那些原本只是在口语或社交平台中的“误用”,很可能被逐渐固化成正式的书面语。它们被写进新闻稿、广告文案、各类文章,获得了某种“合法”的外衣。这样一来,AI生成的错误文本就可能变成常态,常态就可能变成新的规范。如此循环往复,语言的堤坝便一寸一寸地被侵蚀。
现在再看朱德熙那个“势利眼”的比喻,他要表达的是语言学家的审慎:某个“不合法的用法”,必须等到它被社会“普遍承认”之后才能点头。这是一个有机的、自发的过程,但它的前提是使用语言的人在认真地使用语言,他们在乎自己说的是什么,会自觉或不自觉地遵守一种共识,也会对那些不对劲的语言表达保持敏感。
AI的介入则打破了这种机制。它不参与人类关于语言规范的讨论,目前也应该还没有“犯错”的意识。这就是AI时代语言规范面临的新挑战。当大量文本由模型自行生成,这些文本又反过来成为新的训练数据时,语言的演变可能就不再是一个人类社群内部有意识、有选择的进程,而可能成为一种被AI介入的、缺乏束缚的“漂移”。我们会漂向哪里?不知道。但可以说,方向不再完全由我们决定。
面对现状,人们大概会有三种态度。
第一种是放任。“语言本来就是不断演变的,何必大惊小怪?”这种论调听起来豁达,实则不负责任。语言固然是活的,但“活”不等于“乱”。语言的活力来自使用者的创造,而不是来自对错误的宽容。当误用和讹传被AI放大、固化,语言就失去了它应有的精确性,而精确性,恰恰是语言作为人类交际与思维工具的关键特性。
第二种是拒斥。有人主张甚至要求在各种领域禁用AI写作。这种想法可以理解,但不太现实。AI生成文本的成本低、效率高,确实在很多场景下提供了便利,完全禁止既不可能,也无必要。同时,我们也要充分相信,语言本身具备适应和调节的机制,语言生态在广大语言使用者的共同维护下不会被AI冲击得“面目全非”。
第三种态度是什么?语言学家的“势利眼”或许能给我们启发。他不是一味反对语言的变化,而是强调要有一个“观察期”,要等一种用法“被社会普遍承认”之后才能接纳它。这意味着我们今天要有意识地重建一种机制——在AI文本和人类语言之间,摆一道“审查”关。
这个“审查”是一种集体的语言自觉,至少包括以下几个层面:
教育层面。语文教育应当重视语言的基本功,培养学生对语言的敏感,让他们能分辨什么表达准确、鲜明、生动,什么表达似是而非。一个接受了良好语言训练的人,才会在使用AI辅助写作时,有足够的判断力去主导写作,而不是被AI带跑。
媒体层面。报纸杂志、出版社、内容平台应该参与到语言“把关人”的行列中。朱德熙曾在《大家都有责任》一文中说,改进文风,语文工作者、作家、翻译工作者、编辑工作者责任尤其大。这句话在今天依然有效,并且涉及的范围更大了。当AI生成的内容越来越多地进入公共传播领域,专业的编审就变得更加重要。一篇经过认真编辑的文章,不仅是在传递内容中的真知灼见,也是在为语言规范树立标杆。
技术层面。大语言模型本身也可以进一步改进、规范。未来的模型是否可能引入更多的约束机制?比如,在训练数据中提高优质的、规范的文本的权重,降低低质文本的影响。尽管相关的技术路径仍在探索中,但我想,方向是明确的:让AI学会“说好汉语”,而不只是“说汉语”。
汉语是一种有着深厚传统与历史的语言,几千年来,它经历过无数变化。然而近代以来,汉语的每一次巨变都伴随着某种焦虑。五四时期,有人担心白话文会毁掉汉语的美感;20世纪90年代,有人担心网络语言会让汉语变得粗鄙。这些焦虑中有的被证明是多余的,有的则确实指出了问题。
AI时代带来的变化,或许比以往任何一次都更深刻。因为以往的变化,无论多么剧烈,始终是人在变、人在用、人在选。而这一次,AI参与进来,并且扮演着越来越重要的角色。AI可以做到“倚‘码’千言”,但它还不够“认真”,认真是我们的事。
回到2025年的高考语文试题。朱德熙在文章中还说了这样一句意味深长的话:“一个人写文章时用语不符合一般人的习惯,别人对作者和他的文章也会有看法。文章是写了给人看的,我们不能不考虑它的社会效果。”目前的AI可以海量生成文章,但还理解不了这背后的东西,那就是人对自己所说所写的语言的责任。每位在考场上答题的年轻人,在不知不觉中参与了一场关于语言规范的讨论:语言的变化有没有边界?谁有权决定这些边界?答案不在试卷上,在每一个执笔者的手中。
(作者系澳门大学人文学院博士研究生)
