图片来源:图虫创意
HBO出品的美剧《硅谷》有这样一处情节:主人公好友“大头”阴差阳错当上了Hooli XYZ实验室(原型Google X)领导人,在Hooli CEO盖文·比尔森迫切需要颠覆性技术为失败项目“填坑”时,他所展示的就是通过可穿戴设备,将实验者心中所想转换成文字,输出到智能手机上。当公司领导层激动不已,摩拳擦掌预备大干一场时,却遭无情补刀——“要等到他孙子那一代才有可能看到”。
然而,根据《Nature》的封面故事报道,此项技术距离我们并未远到“孙子一辈”。斯坦福团队最新开发的一项脑机接口技术可以将瘫痪人士脑中意图直接转换成文字,实现更灵敏、更快的输出。
与市面常见的声控、眼动仪等设备不同,脑机接口主要通过捕捉神经活动信息以做分析。一方面,与健全人士相比,残障人士丧失了视觉、声音等能力,在表达上会遭遇门槛限制。另一方面,研究统计,眼动仪追踪键盘能让残障人士每分钟打出47.5个字符,而健全人士每分钟能打出115个字符,速度只有其一半左右。
此前脑机接口有非侵入式与侵入式之分,但其或提供视觉线索,或让用户控制可选择按键的光标,都需要用户“参与决策”,占据使用者的注意力,从而使打字速度受限。
而Willett等人组建的斯坦福开发团队,使用侵入式脑机接口(iBCI,需要在脑中植入电极),能够在接口中完成打字任务,让用户以自己的节奏想象书写,从而解码他们想要的字母。
新技术主要由植入电脑的电极负责测量多个神经元的活动,而一种基于深度学习的循环神经网络模型(recurrent neural network,RNN)通过聚类分析神经元之间的相关性,自主学习神经活动模式,从而预测使用者想要的字母,再转为印刷文字。
据团队介绍,算法实现的预测与自学习能够显著提升输出字母的准确性,新技术的准确度已达到99.1%,研究对象可以每分钟90个字符的速度打字。
相比于更具话题性的“读心术”,脑机接口用于残障人士的技术前景是该领域的共识。马斯克(Elon Musk)创立的脑机公司Nueralink,此前发布过一项能够让植入芯片的猴子用意念打电子游戏的技术。马斯克曾在推文中表示,该技术设计最初是面向瘫痪人士的,并看好脑机技术有望帮助他们恢复说话、行走的“自由”。
目前,斯坦福团队已将相关数据免费开放。据其介绍,新技术在使用寿命、不同环境下的稳定准确识别率等方面有待进一步研发升级。此外,输出文字还需继续推出英语之外其他翻译版本,希望未来能够真正实现“即插即用”、“读你所想”。