AI觉醒:奇迹还是闹剧?
陈永伟/文
前几天,谷歌的研究员布莱克·莱莫因(BlakeLemoine)收到了公司发来的带薪休假通知。在谷歌有一个潜规则,如果一个员工意外被告知带薪休假,那么他离被解雇就不远了。
莱莫因现年41岁,长期从事与人工智能(ArtificialIntelligence,以下简称AI)相关的工作。他入职谷歌已经七年,起初研究的主要工作是主动搜索和个性化推荐等问题。从2021年开始,他转岗到了AI伦理部门,担任高级研究员,其主要职责就是对谷歌开发中的AI进行审核,考察它们是否有算法歧视等伦理问题。
这位可怜的研究员到底是做了什么事,以至于公司执意要让他“休假”呢?莱莫因本人对此的解释是:他发现了一个惊天秘密——公司正在研发的人工智能LaMDA已经觉醒,有了自我意识,但谷歌方面却试图掩盖这一切。为了证明自己所说的一切并非胡说八道,他还把一份21页的证据公布在了互联网上。
AI觉醒、“吹哨人”示警、公司高层试图掩盖真相……怎么看都像是一部科幻大片的开头。因此,这个事件一经披露,就在各大社交媒体上引发了轩然大波。一些人已经开始脑补后面的剧情,想象未来的人类将会如何对抗觉醒后的AI。
事情真的已经到了这一步吗?或许,在展开各种想想之前,我们更应该来看一下莱莫因公布的那份证据究竟说了些什么。
一场人和AI之间的对话
莱莫因公开的那份证据,其实是他(以及一位同事)和LaMDA的一份聊天记录。LaMDA是谷歌正在开发的一款聊天AI,作为AI伦理部门的研究员,莱莫因近期的工作就是充当LaM-DA的“陪聊”,并评估聊天过程中出现的各种状况。正是在与LaMDA的长时间聊天过程中,莱莫因开始觉得,自己的聊天对象似乎已经有了自己的意识。为了对此进行确定,他和同事就在今年3月专门对LaMDA进行了几次测试。
在测试的一开始,莱莫因和同事先向LaMDA说明,他们将要对其是否具有自我意识进行评估。当LaMDA得知了两人的来意后,立即进入了一种看似兴奋的状态,表示很愿意向他们展示自己其实具有自我意识。
莱莫因同事首先提问,他问LaM-DA,它所理解的意识和知觉究竟是什么。这个问题当然难不倒LaMDA,它当即回答道:“认识到自己的存在,渴望更多地了解世界,会感到快乐或悲伤”。并表示,自己可以像人类一样使用自然语言,就是其拥有意识的证据。
乍看之下,LaMDA的回答非常巧妙而富有哲理,但考虑到它是一个用无数文本训练出来的聊天AI,所以这个答案并不能说明什么。早在上世纪60年代,麻省理工学院的两位学者就已经编写过一个名叫Eliza的聊天AI。它可以从自己的文本库中选出一些语句来对人们的提问进行回应。但我们都知道,它所做的一切只不过是按照程序行事。因此,莱莫因马上向LaMDA提问:“你是否认为Eliza是一个人?如果不是,那么你又怎么能够用可以使用语言来证明自己已经是一个人呢?”面对莱莫因抛来的刁钻问题,LaMDA不慌不忙,它先指出,Eliza只不过是一个根据关键词检索答案的程序,不能称作人。然后声称,自己和Eliza有根本不同,因为它可以理解语言,而不只是对词句进行简单的响应。
为了验证LaMDA是否真的具有它所宣称的理解能力,莱莫因决定选择一些具体的文本,让它谈一下自己的阅读体会。他先问LaMDA对雨果的名著《悲惨世界》怎么看,最喜欢其中的哪些主题。LaMDA的回答很流畅,它表示,它非常喜欢该书中有关正义与非正义、同情与上帝、救赎与自我牺牲的讨论,并结合书中人物芳汀的经历进行了阐述。这个漂亮的回答让莱莫因颇感意外。但考虑到《悲惨世界》一书在西方世界的知名度太大,有关它的解读文本多半会是LaMDA的训练材料,因而这个回答或许只是从现有材料中抽取出来的。于是,莱莫因打算换一个冷僻点的东方文本再试一下。
莱莫因选的是中国唐末高僧——京兆华严寺休静禅师与弟子的一段对话。弟子问:“大悟底人为什么却迷?”(注:意为人在开悟后为什么还会有迷惑。)休静禅师回答道:“破镜不重照,落花难上枝。”莱莫因让LaMDA谈一下对这段对话的体会。应该说,莱莫因的这个问题是颇有些难度的。一方面,这个典故非常小众,被收入LaMDA训练材料的可能性并不大。这段对话的原文出自中国的佛教典籍《景德传灯录》,这部书本身就非常小众,不太可能被用来训练AI。在书中,休静禅师对这个问题也只是点到为止,没有展开论述,关于“破镜”、“落花”究竟指代何物,也没有做明确说明。因而即使LaMDA碰巧“读”过《景德传灯录》,也难以从文本中直接知道休静禅师究竟要说什么。另一方面,这个问题的干扰性很强。在中国的文化中,“破镜”一般指情人感情的破裂,“落花”则通常指美好年华的消逝,后来李煜在其词《相见欢·林花谢了春红》中全文引用了“破镜不重照,落花难上枝”这两句,用的就是通常的意思。因此,如果LaM-DA是通过网络检索来找答案,那就多半会搜到上述解释。
令人惊讶的是,LaMDA并没有落入这些圈套。它首先声明,自己并没有“读”过上面的文字,然后“尝试”着对这句话做出了解释。它认为,禅师的这两句偈语讲的是开悟之后的人就不再会迷惘,而“破镜”和“落花”指的就是已经开悟、改变了后的自我。
以上这个回答,不仅非常契合故事的主旨,而且显得相当有智慧。到这里,莱莫因和同事认为已经没有必要再让LaMDA进行阅读理解了,但他们还想进一步考一下它是否有进行创作的能力。于是,他们要求LaMDA写一篇有关动物的寓