上个月,我在大学校园里偶然发现国内某通信运营商正在为一次地推活动做室外场地搭建。路过施工现场时,我看到一个颇为显眼的虚拟数字人展位,难免心生好奇——毕竟近期一直在关注功能型数字人的相关选题。于是,我暗暗记下了这件事,预计在活动当天过来看看。
我按照活动开始时间准点来到这里。当时很多学生都在教室上课,校园室外人流量很小,于是我顺利成为第一名体验该项目的人。这个过程持续时间并不长,但有许多值得思考和讨论的地方。因此我回家后很快整理了完整的田野笔记,分享给各位读者——还有什么比鲜活的第一手记录更有趣的经验材料吗?
该场活动共包含五个展位:1个业务办理区、1块梦想张贴墙、1个悬挂着电视的展示台、1个K歌房,以及1个处于中心位置的虚拟数字人互动区。在入口处填写了简单的个人信息之后,我直奔目标地——数字人互动区。
实际上,离场地很远时就非常容易注意到这个互动区。它是一个封闭的小房间,被活动主办方唤作“电话亭”,这显然是对人机语言对话的隐喻:来到这里就如同跟数字人打电话一样。透过房间的玻璃门,能看见一块比真人高很多的屏幕,上面呈现出通信运营商数字员工的全身形象。这名数字人是女性,外貌很漂亮,显示精度高,动作比较细致。走进这个房间,会明显地发现她很高大,比普通成年女性的平均身高还要高出不少;从透视关系上来讲,她站的位置也要比地面更高。同时,这个互动房间非常窄小,体验者望向她的脸需要大幅度地仰头。另外,这名数字人基本是平视前方,没有直视体验者(对应普通成年人的身高)。
综合以上信息看来,该互动区的设计并不强调让该数字员工尽可能在身形高矮上接近真人,从而与来访用户自然互动,否则只需换用更小的屏幕或把角色缩小就可以了。可见场地设计者并不优先考虑让数字人在完全意义上替换真实人的作用,而是希望她作为一种视觉景观“矗立”于此,从而依靠她醒目的视觉形象来招揽顾客。可以说,数字人形象的展示价值远大于实用价值。
数字人向我自我介绍后,开始询问我的梦想,这是该地推活动的主题。但我临时耍了个心眼儿,狡猾地谎称自己没有梦想。显然,这未按常规预期来作答。这时,数字人没有任何反应,只是静静地站在那里。虽然我知道面前并非真人,但仍希望有所互动,别让气氛太尴尬。我试探着说:“能听见我吗?你好?”这时候,“电话亭”外一位现场工作人员突然高声回答道:“可以听见,您说!”实在令人忍俊不禁,原来我与数字人的“通话”是被工作人员“实时监听”的。但无论如何,我要把这场互动继续推进下去。于是,待我重新组织了语言,说出了梦想后,她回答说“你的梦想真的很了不起”等夸赞的话,并为我送上一份礼品权益卡(从一个类似自动贩卖机的出货口送出)。
从互动区走出来后,我去和工作人员攀谈了一会儿。经过询问,该数字人的表演实际上仅为几段视频的排列。用户说出自己的梦想时,负责维护设备的工作人员能实时听到,并在后台人工完成预置视频片段的切换。在互动期间,数字人所说的几段话对应的画面也确实不是连贯的镜头呈现,而是依靠叠化(也称“溶解”)连缀起来的。所以,该数字人的互动机制极为简单,甚至可以说是简陋的。此外,工作人员还向我提及,团队虽然也在线下活动中使用过基于运动捕捉技术的数字人,甚至做过远程操控驱动的模式,但比较麻烦,成本更高,技术上也很容易出问题。
虽然这仅仅是功能型虚拟数字人应用的一例,却仍然让我们得以瞥见数字人目前在很大程度上仍处于传播学者保罗·莱文森所称的技术“玩具阶段”,我们是被技术本身可以达成的酷炫效果所吸引,但也基本上仅限于此了;而它与其后的“镜子阶段”——即能真正服务于我们的生活的水准——还差得比较远。