铜灵 发自 凹非寺
量子位 出品 | 公众号 QbitAI

今天,加州大学旧金山分校(UCSF)和Facebook在Nature Commuications上发表的一项研究显示:

他们在“非植入式”的穿戴设备上取得了最新进展,构建出了一个大脑-计算机系统,能准确解码佩戴设备的人听到和说出词语和对话,实时从大脑信号中解码。

也就是说,在这种脑机接口面前,你的所思所想已无处遁形,Facebook已经让意念打字成为了现实

此前,马斯克的脑机接口公司Neuralink也发布过脑机接口系统,但这种植入式的设备需要向大脑中植入3000多个电极,以此来检测神经元的活动,但非植入式的设备就免去了复杂的植入步骤。

研究人员表示,目前对生成和感知的两部分语言进行解码,准确率超出了他们的想象,分别能达到61%和76%的准确率。

这项项目对于正常人和残疾人来说,都具有实用意义。

比如,你可以将思维直连到语音助手siri,查询天气、搜索信息不用直接喊出来了。

研究人员之一、加州大学旧金山分校神经外科医生Edward Chang表示,这是向神经植入物迈出的重要一步,因为中风,脊髓损伤或其他疾病而失去说话能力的患者,有望因此获得自然交流的能力 。

如何意念转语音

这项成果来自Facebook Reality Labs,一直与加州大学旧金山分校合作开展这项脑机接口的研究。

Facebook的设想是,设计一种可以将大脑信号转换成语言的装置,不需要劳动任何一块肌肉,深度学习就能直接读懂大脑,解码脑中所想,实现流畅交流。

为了进行试验,研究人员此前还招募了五名在医院接受癫痫治疗的志愿者。

他们先是从高密度皮层活动中提取相关信号特征。志愿者们说了上百句话,而通过植入性大脑皮层电图(ECoG),研究人员可以跟踪控制语言和发音的大脑区域的活动,并将这些活动与志愿者说话时嘴唇、舌头、喉部和下颚的微妙运动联系起来,然后将这些运动学特征翻译成口语句子。

研究人员采用bLSTM(bidi-rectional long short-term memory)循环神经网络来破译ECoG信号表达的运动学表征。

接着用另外一个bLSTM解码先前破译的运动学特征中的声学特征。

在这个过程中,两个神经网络都会被投喂训练数据,以提高它们的解码性能。

在今年的四月份,利用这样的方法,Facebook已经实现了以每分钟150词的速度帮你说出所思所想。

而在这篇最新的论文Real-time decoding of question-and-answer speech dialogue using human cortical activity中,他们在此前研究基础上,研究人员想进一步提高精度。

大多数语音解码的工作原理是对一个人在想什么声音做出最佳猜测,在解码过程中可能会被“synthesizer”和“fertilizer”这类发音相似的单词混淆。

但Facebook的新系统增加了上下文信息来帮助区分这些单词。

首先,这个算法预测从一组已知问题中听到的问题,比如“你在一块土地上撒了什么?”然后,这些信息作为上下文来帮助预测答案:“肥料”(fertilizer)。

Edward Chang表示,通过添加上下文,这个系统能够用的指定问题和答案解码感知(听到)的语音准确率达到76%,解码产生(口头)的语音准确率达到了61%。

Facebook表示,未来将扩大系统的词汇量,让其能适用在更广泛的领域。

缘起两年前

Facebook早在两年前,就开始着手这个项目了。

2017年4月,Facebook旗下的前沿产品研发团队Building 8负责人Regina Dugan宣布,这家社交网络公司将在未来两年内,开发出一个能以每分钟100字的速度从人脑向外传输语句的“帽子”。

Facebook设想中的“帽子”,是用来分享你的思维的。此前清华大学也做过类似概念的研究,头戴一个小巧的电极帽,控制屏幕软键盘上的26个字母就能打出任何语句。

Facebook最终计划,是想打造一款AR眼镜。

Facebook AR/VR业务副总裁Andrew “Boz” Bosworth表示,这个项目的初衷,是想构建一个非侵入式可穿戴设备,让人们只想通过想象他们想说什么来打字,展示未来对AR眼镜的投入和互动成为现实的潜力。

传送门

Facebook官方博客:
https://tech.fb.com/imagining-a-new-interface-hands-free-communication-without-saying-a-word/

论文Real-time decoding of question-and-answer speech dialogue using human cortical activity
地址:
https://www.nature.com/articles/s41467-019-10994-4

论文Speech synthesis from neural decoding of spoken sentences:
https://www.gwern.net/docs/ai/2019-anumanchipalli.pdf

加入社群 | 与优秀的人交流

小程序 | 全类别AI学习教程

量子位 QbitAI · 头条号签约作者

վ'ᴗ' ի 追踪AI技术和产品新动态

喜欢就点「好看」吧 !

意念实时转语音!Facebook的非植入式脑机接口,解码准确率达到76%相关推荐

  1. 非侵入脑机接口新突破!用意念控制光标,连续追踪效果提升5倍

    来源:智东西 看点:CMU研究人员在使用非侵入式脑机接口开发了第一个成功用意念控制的机械臂,展现了连续追踪和跟踪计算机光标的能力. 智东西6月23日消息,卡内基梅隆大学与明尼苏达大学的研究人员在非侵入 ...

  2. 首个双手控制脑机接口:开颅手术 10 小时植入 6 个电极,瘫痪人士用意念吃蛋糕

    本文转载自 雷锋网,作者 付静 有这样一位名为 Buz Chmielewski 的男子,曾在一次出海冲浪时不幸遭遇意外,四肢瘫痪.从正值十几岁的大好年华到此后的 30 余年里,Buz Chmielew ...

  3. 用“意念”发Twitter,静脉植入脑机接口电极,渐冻症患者把思想转化为文字

    晓查 发自 凹非寺 量子位 报道 | 公众号 QbitAI 一名62岁的渐冻症(ALS)患者,发出了自己的第一条Twitter,他也成为全球首个用植入式脑机接口发布推文的人. 不需要按键或声音,这条推 ...

  4. 马斯克看上的脑机接口公司:“意念控制”iPad发短信,浏览新闻无压力

    这是一个iPad上的聊天截图. 看似平平无奇,但你猜灰色框的消息是怎么发出来的?(大胆猜!) 既非手打也非语音,它是一位渐冻症(ALS)患者植入脑机接口后,通过"意念"控制iPad ...

  5. 首位植入脑机接口的患者通过Twitter发布信息

    脑机接口公司Synchron 给一名患有肌萎缩侧索硬化症(ALS) 的患者(PhilipO'Keefe)植入了脑机接口,PhilipO'Keefe将他的想法直接转化为文字,并首次通过 BCI 直接在社 ...

  6. 用意念就能控制的操作系统?这家华人团队做的脑机接口,3个电极实现脑波成像...

    萧箫 发自 凹非寺 量子位 报道 | 公众号 QbitAI 脑机接口,又有了新成果. 8月27日,华人脑机接口公司BrainCO,在哈佛大学展示了他们研发人类大脑智能操作系统BrainOS的初步成果. ...

  7. 猴子用意念玩游戏,马斯克脑机接口公司新进展

    近日,马斯克的脑机接口公司Neuralink 在 YouTube 上发布了一段新的视频.视频中的猴子通过大脑意念来控制屏幕上的光标,从而实现仅用大脑意念来玩Pong[一款关于兵乓球的电子游戏]. 马斯 ...

  8. Facebook 研发可穿戴脑机接口,读心术成真?

    Facebook正式进军下一代脑机接口领域了! 作者 | Sean Jackson 译者 | 胡雪蕊,责编 | 郭芮 出品 | CSDN(ID:CSDNnews) 以下为译文: Facebook日前宣 ...

  9. 脑机接口科普0009——侵入式与非侵入式的优缺点

    本文禁止转载!!!! 在上文脑机接口科普0008--侵入式与非侵入式_sgmcy的博客-CSDN博客中,我们科普了三个术语,EEG, ECoG,LFP.并且,我们做个一个简单的划分归类,我们把EEG划 ...

最新文章

  1. 复制订阅服务器和 AlwaysOn 可用性组 (SQL Server)
  2. oracle 数据更新
  3. MongoDB简介、在node中使用MongoDB
  4. 【LeetCode】24. Swap Nodes in Pairs
  5. java实现单词或字符串反转
  6. [转载]针对IIS7以上的ASP.NET网站自定义错误页面与异常日志总结
  7. 平安资管罗水权:建设债券投资的智慧中台
  8. mysql数据库操作常用命令_MySQL数据库操作常用命令小结
  9. python怎么让py里面逐行运行_Python读写文件详解,看完这篇即可完全理解「收藏」...
  10. 解决Windows路径太长的目录及文件如何删除
  11. 安全提示:勒索病毒漏洞与CPU漏洞务必小心
  12. Multisim14 - 运行10版本文件时数码管一直显示为0的问题
  13. GCJ-02火星坐标系和WGS-84坐标系转换关系
  14. 二阶IIR滤波器系数计算方法
  15. 【Vue.$delete】 删除
  16. word2016文档怎样添加封面?简单技巧!word文档如何设置加入封面?
  17. 网页中单个页面如何做好SEO优化
  18. 对Si446x驱动库的一些修改
  19. 什么是单工,半双工,全双工
  20. 周涨粉超30w B站UP主非非宇Fay粉丝增长密码是什么?

热门文章

  1. Scrapy框架的使用之Scrapy对接Selenium
  2. checkpoint process vs writer process vs wal writer process
  3. C语言:指针的几种形式
  4. suse11 oracle11g 安装
  5. Elasticsearch的Shield插件
  6. 转-Android中自动连接到指定SSID的Wi-Fi
  7. card样式 layui_layui样式修改
  8. iOS 9音频应用播放音频之ios9音频基本功能
  9. ARP侦查工具Netdiscover
  10. oss客户端工具_阿里云服务器ECS上使用ossfs工具挂载阿里云OSS存储