假肢设备破译来自大脑语言中心的信号,以预测一个人试图说什么声音。
杜克大学的神经科学家、神经外科医生和工程师团队开发了一种语言假肢,可以将大脑信号转化为口语。
这项新技术在最近发表在《自然通讯》杂志上的一篇论文中进行了详细介绍,它为患有损害言语的神经系统疾病的人提供了希望,有可能使他们能够通过脑机接口进行交流。
应对神经系统疾病的沟通挑战
“有许多患者患有使人衰弱的运动障碍,如ALS(肌萎缩侧索硬化症)或闭锁综合征,这会损害他们的说话能力,”杜克大学医学院神经病学教授Gregory Cogan博士说,他是参与该项目的主要研究人员之一。“但目前可用于让他们进行交流的工具通常非常缓慢和繁琐。
一个不比邮票大的设备(白色带内的虚线部分)包含128个微观传感器,可以将脑细胞活动转化为某人想要说的话。
想象一下以半速收听有声读物。这是目前最好的语音解码率,每分钟大约78个单词。然而,人们每分钟说大约 150 个单词。
口语和解码语音之间的滞后部分是由于相对较少的大脑活动传感器,这些传感器可以融合到位于大脑表面的薄如纸的材料上。更少的传感器提供的可破译信息较少。
增强大脑信号解码
为了改善过去的局限性,Cogan与杜克大学脑科学研究所的教员Jonathan Viventi博士合作,他的生物医学工程实验室专门制造高密度、超薄和灵活的大脑传感器。
与目前具有128个电极的语音假肢(左)相比,杜克大学的工程师开发了一种新设备,该设备可容纳两倍的传感器,而占地面积要小得多。
在这个项目中,Viventi 和他的团队将令人印象深刻的 256 个微观大脑传感器包装在一块邮票大小的柔性医用级塑料上。相距仅一粒沙子的神经元在协调语音时可能具有截然不同的活动模式,因此有必要区分来自邻近脑细胞的信号,以帮助准确预测预期的语音。
临床试验和未来发展
在制造出新的植入物后,Cogan和Viventi与杜克大学医院的几位神经外科医生合作,包括Derek Southwell博士、Nandan Lad博士和Allan Friedman博士,他们帮助招募了四名患者来测试植入物。该实验要求研究人员将该设备暂时放置在因其他疾病而接受脑部手术的患者身上,例如治疗帕金森病或切除肿瘤。Cogan和他的团队在手术室试驾他们的设备的时间有限。
“我喜欢将它与 NASCAR 维修人员进行比较,”Cogan 说。“我们不想在操作过程中增加任何额外的时间,因此我们必须在 15 分钟内进出。当外科医生和医疗团队说’开始!’时,我们立即采取行动,病人执行了任务。
这项任务是一个简单的聆听和重复活动。参与者听到一系列无意义的单词,如“ava”、“kug”或“vip”,然后大声说出每个单词。该设备记录了每个患者的言语运动皮层的活动,因为它协调了近100块移动嘴唇、舌头、下巴和喉咙的肌肉。
之后,新报告的第一作者、杜克大学的生物医学工程研究生Suseendrakumar Duraivel从手术室中获取了神经和语音数据,并将其输入机器学习算法,以了解它如何准确地预测正在发出的声音,仅基于大脑活动记录。
对于某些声音和参与者,例如“gak”一词中的/g/,解码器在84%的时间内正确了,因为它是构成给定无意义单词的三个字符串中的第一个声音。
然而,准确性下降了,因为解码器解析出一个无意义单词的中间或末尾的声音。如果两个声音相似,比如 /p/ 和 /b/,它也会很困难。
总体而言,解码器在40%的时间内是准确的。这似乎是一个不起眼的测试分数,但考虑到类似的大脑到语音的技术壮举需要数小时或数天的数据才能得出,这令人印象深刻。然而,Duraivel 使用的语音解码算法仅处理了 15 分钟测试中 90 秒的语音数据。
Duraivel和他的导师们对美国国立卫生研究院(National Institutes of Health)最近拨款2.4M美元,制作了该设备的无线版本感到兴奋。
“我们现在正在开发相同类型的录音设备,但没有任何电线,”Cogan说。“你可以四处走动,而且不必被绑在电源插座上,这真的很令人兴奋。”
虽然他们的工作令人鼓舞,但 Viventi 和 Cogan 的语音假肢要想很快上架还有很长的路要走。
“我们正处于它仍然比自然语言慢得多的地步,”Viventi在最近杜克杂志上发表的一篇关于这项技术的文章中说,“但你可以看到你可能能够到达那里的轨迹。
暂无评论内容