第A12版:科技

与逝者跨时空对话 AI仅会模仿还不够

  “如果有个直达天堂的电梯,我一定不顾一切去看你。”日前火爆抖音的这首神曲唱出了不少人对已逝亲人的怀念之情。随着人工智能技术的发展,与逝者的跨时空对话或有可能实现。百度董事长兼CEO李彦宏曾表示,人工智能让每个人说的每句话、干的每件事,甚至记忆、情感、意识都能以数字化的形式存储下来放在网盘或者其他云端,思维方式也可以被机器学习,并且通过技术进行还原,与后人进行跨越时空的对话。

  模拟和逝者对话 国内外均有尝试

  “这种模拟已逝的人与后人进行对话的事情在国内外都有过尝试。”天津大学智能与计算学部博士生导师王龙标教授介绍,2011年日本大地震,许多人的生命就此定格在那个瞬间。日本找了一些科研人员,收集遇难者生前保存的声音,模仿逝者的口吻写了遗书,并且通过语音合成技术,还原出逝者的声音并且读给家属听。家属听了以后都非常感动,觉得了却了自己的一个心愿,很多人也因此放下悲伤,勇敢去面对未来的人生。

  在国内比较广为人知的尝试就是2016年,在张国荣诞辰60周年纪念活动上,百度语音技术团队公布了一段“张国荣”与粉丝的对话实录视频。这段视频是百度语音技术团队通过机器和人工双重搜索全网张国荣的原声和采访资料后,合成的张国荣生前的声音,并且在录制视频之前征集粉丝想法,与粉丝一起完成的“互动”视频。

  “以上的这些尝试都只停留在模仿逝者语音、语言方式层面。”王龙标说,已逝者说的内容基本上都是科研人员事先编辑好的内容,虽然目前在技术上计算机能自动生成文本和文字,但是模仿的效果还不是很理想。比如像日本那个案例,目的就是鼓励生者更好地生活下去,如果内容编辑不当,反而会适得其反。因此这些尝试,都不是真正意义上和后人“对话”。

  做到原音重现需收集大量数据

  “无论是已经能够实现的模拟逝者单方面的说话,还是未来要想实现的跨时空对话,目前的技术首先都离不开逝者生前大量的数据收集。”王龙标说,计算机要学习某个人,必须要先大量收集这个人的各种信息,在这个人生前就要把他写的文字、声音、图像、脑信号等通过各种形式保存下来。比如模仿写作风格,必须要收集他以前写过的书信、文章等;模仿一个人的语言,就需要通过录音了解他的口音、发音习惯、习惯用语、语言逻辑等。数据收集得越全,机器会模拟得越相似,这就和夫妻相一样,夫妻朝夕相处久了,会潜移默化地在行为方式、语言习惯等方面高度相似。百度相关负责人曾表示,张国荣的“答粉丝信”原音重现,之所以仍存在一些顿挫感,出现某些字词发音略不自然等情况,部分原因是受到相关情景语料缺失的限制。

  在收集大量数据的基础上,一般来说,模拟逝者语言需要语音合成、机器学习、自然语言处理等技术。如果要想做成更有感情的语言,还需要情感计算。具体来说,就是把情感因素通过计算机的方法识别和表达出来,比如这个人的语言、写的文字、各种肢体动作都代表什么情感,然后让机器去模仿并生成情感,写具有情感的文章,生成具有情感的语言,或者表达一些具有情感的肢体动作。

  实现隔空对话脑科学研究不可少

  要实现对话,语音对话技术也必不可少,这就需要机器对对方的语言进行判断识别,并且理解、自动生成文本。目前比较常见的智能音箱应用的就是语音对话技术。不过很多时候,这些智能音箱回答的问题似是而非。王龙标表示,要想实现机器和人之间良好的互动,就需要机器能模仿人的思维和情感。

  据报道,目前瑞典科学家正进行研究,通过在大脑植入微型装置,让使用者得以上载及下载自己的思想。王龙标表示,目前的情感计算,大部分是基于数据驱动的机器学习技术。如果想实现真正意义上的模拟人的意识、情感,还涉及到脑科学的范畴。

  虽然保存一个人的信息似乎可以让他精神永生,并能给生者带来极大的安慰,但是这种做法也存在一定的风险。王龙标表示,不排除有些人会恶意利用这些逝者的信息,为了达到自己的某种目的,模仿逝者的声音,同时把自己的意图加入进去,假冒逝者的想法去操控活着的人。

  此外,这种通过人工智能实现的“精神永生”还可能涉及到伦理问题。这有点像克隆技术,如果未来可以通过芯片技术达到模拟逝者思维的目的,甚至通过基因编辑的方式去保存复制人的思维,这些做法就很可能赋予机器人自主意识。机器人可能会有自己的思想、喜怒哀乐等情感,那么这种具备他人意识的机器人是否会面临伦理风险呢?而且当这些机器人被赋予了“生命”,其脱离控制又该如何处理?

  (科技日报)