这项人工智能技术可从参与者大脑活动中解码单词和句子,其准确性令人不可思议,但仍无法达到100%精准,人们仅需几秒钟的大脑活动数据,即能通过人工智能技术推测出人们听到什么内容,他们在一项初步研究中发现,参与者从选择性测试中找到正确答案的概率平均达到73%。
【资料图】
未参与该项研究的爱尔兰都柏林三一学院计算机科学家乔瓦尼•迪•利伯托(Giovanni Di Liberto)称,人工智能的表现已超出许多人认为可能实现的水平。
8月25日,有媒体报道称,Facebook母公司Meta研发一项最新人工智能技术,最终有望应用于全球数以万计无法通过语音、打字或者手势进行交流的人群,其中包括:最低限度的意识状态、闭锁综合症或者“植物人状态”患者,现在他们通常被称为无反应清醒综合症人群。
据悉,目前大多数帮助语言表达障碍人群的技术具有一定程度的身体侵入性,需要进行高风险脑部手术植入电极,Meta公司AI研究员、神经科学家珍妮-雷米·金(Jean-Remi King)表示,最新研发的人工智能技术有望提供一种可行方案来帮助沟通障碍患者,而不是使用侵入性方法。
珍妮和同事研发了一种计算工具,可以检测53种语言的56000小时语音录音中的单词和句子,该工具也被称为语言模型,学习如何在细微等级(例如:字母或者音节)和更广泛等级(例如:单词或者句子)识别语言的具体特征。
该研究团队将带有语言模型的人工智能系统应用于4个机构的数据库,其中包括169名志愿者的大脑活动,在这些数据库中,参与者倾听不同的故事和句子,例如:作家欧内斯特·海明威的《老人与海》和刘易斯·卡罗尔的《爱丽丝梦游仙境》,期间工作人员使用脑磁波描记器(MEG)或者脑电图仪对参与者的大脑进行扫描,这些设备可以测量大脑信号的磁成分或者电成分。
之后在一种有助于解释实际大脑间物理差异的计算方法帮助下,研究团队试着利用每位参与者3秒钟的大脑活动数据来解码他们听到的内容,他们指示人工智能系统将故事录音中的语音与人工智能计算出人们听到的内容相对应的大脑活动模式进行匹配,然后依据1000多种可能性,预测参与者在短时间内可能听到的内容。
研究人员发现使用脑磁波描记器进行测试,参与者选择的前10种可能性答案的准确率达到73%,然而通过脑电图仪的测试结果,该准确率下降至不足30%,因此脑磁波描记器性能非常好。利伯托说:“但是我们预测该系统的实际应用并不乐观,它能有什么用途呢?脑磁波描记器是一部笨重且成本昂贵的机器,将该项技术应用于诊所需要技术创新改良,从而使该设备成本更低、更易于使用。
美国密歇根大学安娜堡分校语言学家乔纳森·布伦南(Jonathan Brennan)说:“在这项最新研究中,理解‘解码’的真正含义非常重要,这个词经常被用于描述直接从信息源破译信息的过程,这里特指从大脑活动中破译语言,人工智能技术可以实现这一点,因为该系统能提供一个有限范围的可能性答案,大幅提高的准确率。对于语言来讲,如果我们想将该人工智能系统扩展至实际应用,这是很难实现的,因为语言应用是无限的。”
更重要的是,人工智能能解码被动倾听音频的参与者信息,这与非语言患者没有直接关联,为了使它成为一种具有意义的交流工具,科学家需要学习如何从大脑活动中解密患者想表达的信息,例如:饥饿、不适表情或者简单的“是”或者“不是”的表情。
事实上,这项人工智能技术是解码语音感知,而不是语音生成,虽然语音生成是科学家的最终目标,但就目前而言,亟待进一步完善提升相关的科学技术。