【简介】“太实用了,以后连键盘都不需要了。”
Facebook不仅在VR领域投入巨资,还关注脑机接口。小扎一直在寻找一种让用户通过思考来创造文本的方法。 Facebook 希望创造一种与技术互动的新方式。用户可以说出自己想说的话,无需使用键盘。
Facebook曾希望将这一功能添加到Oculus中,可以捕获语言,将大脑发出的电信号转换为数字信息,并开发出第一个针对语言的消费级脑机接口(BCI),但最终放弃了,并开放了增加其研究资源。
Facebook对“Legacy”的研究让中风患者再次说话。大脑一直是计算机科学家的天花板。人们一直希望计算机与人类智能之间进行交互。目前,最快的方式是通过脑机接口分享我们的想法。扩展我们的思维能力,甚至可以与超级智能人工智能相媲美。现在,Facebook 已经退后一步,但与它合作的一些实验室继续在将语言转换为文本或口语方面取得突破。这些项目使用直接接触大脑表面的电极直接从源头收集数据。与依赖可穿戴设备的系统不同,使用植入式电极的大脑接口提供更好的信噪比,并且可以记录更详细和具体的大脑活动。
Facebook 的研究合作伙伴加州大学旧金山分校(UCSF) 去年宣布,由神经外科医生Edward Chang 领导的Chang 实验室已经创建了一个有效的思想文本脑机接口。该系统使用聚合物片中的传感器,当放置在大脑表面时,可以拾取用户的神经信号。然后,机器学习系统对这些信息进行解码,以创建用户想说的单词。该系统的第一位用户是一名患有脑干中风的男子,他的头部、颈部和四肢活动极其有限,完全无法说话。自从中风以来,他不得不通过移动头部与他人交流,使用棒球帽上的指针触摸屏幕上的字母。正常情况下,信号通过神经从大脑传输到言语肌肉,但在这些中风受试者中,大脑和发声肌肉之间的线路被切断。当他试图说话时,信号出现了,但未能到达目的地。
脑机接口直接从大脑的言语皮层收集这些信号,对它们进行分析,找出参与者试图移动哪些与言语相关的肌肉,然后利用这些肌肉算出他想说的话,结合这些潜在的肌肉。动作转化为文字。这样,15年前中风的患者就能重新“说话”了。试验参与者能够说出系统能够识别的50 个单词中的任何一个。加州大学旧金山分校研究人员选择这些单词是因为它们要么很常见,要么与护理相关,要么只是参与者希望能够做到的。说出的单词有—— 个,例如“家庭”、“好”和“水”。
脑机接口系统也需要训练,一个单词练习两百遍。为了创建有效的脑机接口,必须训练系统识别哪些信号与哪些单词相关。为了实现这一目标,参与者必须练习说每个单词近200 次,才能创建适当大小的数据集供BCI 软件学习。信号从他大脑中的128 通道阵列中采样,并由人工神经网络进行解释。人工神经网络使用非线性模型,可以学习大脑活动的复杂模式并将其与预期的语音联系起来。
当用户尝试逐字逐句地说出一个句子时,语言模型会预测他尝试说出50 个单词中每个单词的可能性,以及这些单词如何组合成句子。例如,解析为“how are you”而不是“how are good”,尽管两者都使用相似的言语肌肉来提供最终的语音输出。该系统能够以每分钟18 个单词的速度解码参与者的预期语音,准确率高达93%。加州大学旧金山分校的研究团队现在希望将这一试点系统的使用范围扩大到新的参与者,并且已经有很多人询问参与加州大学旧金山分校的思想到文本脑机接口研究。要纳入试验,有很多纳入标准,不仅仅是关于一个人有什么样的残疾,还包括他们的总体健康状况和其他因素,重要的是他们要明白这是一项研究,并且没有保证这项技术将直接让他们受益。
基于每分钟翻译90 个字符的手写图像,侵入性脑脊髓接触装置人体试验中使用的大多数阵列都是由BlackRock Neuroscience 制造的。贝莱德也在开发脑机接口的语言应用程序,与加州大学旧金山分校的实验不同,他们创建了一个基于假想笔迹:的系统。你想象在脑海中写下一个A,然后系统使用斯坦福大学开发的算法以目前的速度转换成书面文本的速度约为每分钟90 个字符,该公司希望最终能达到每分钟200 个字符,与普通人的手写速度大致相同。
该系统已经接近商用,很可能会被患有ALS 等疾病的人使用,这种疾病在后期可能会导致锁定综合症,导致人们无法移动、说话、吞咽甚至眨眼。与此同时,他们的思维仍然像以前一样活跃。尽管脑机接口还处于发展的早期阶段,但语言脑机接口改善患者生活质量的潜力是显而易见的。而且,由于它们直接读取人们的想法,因此还面临数据隐私问题。没有人愿意自己的思想被随意夺走。
一旦使用,脑机接口还涉及维护,例如根据用户偏好定期调整参数设置,以及优化系统以响应疾病或其他可能影响大脑活动的状况的变化。锁定综合症患者的预期寿命在2到5年之间,而脑机接口的成本非常昂贵,所以这也是一个不可避免的经济矛盾。因此,扩大脑机接口的应用范围或降低成本将是未来几年的重要命题。