研究团队利用深度学习神经网络从人脑记录的电信号中合成语音,帮助人们应对语音挑战。

在三个独立的实验中,研究团队使用皮层脑电图(ECoG)来测量受试者在听别人说话或自己说话时大脑中的电脉冲。然后,这些数据被用来训练神经网络产生语音输出。这项工作的动机是创建一个脑-机接口或“语音假肢”,直接将用户大脑中的信号转换成合成语音,帮助那些不能说话的人。

第一个实验是由哥伦比亚大学的一个团队进行的,使用了癫痫患者接受治疗的数据。研究人员将电极植入患者的听觉皮层,并在患者收听简短的口语录音时从电极上收集ECoG数据。研究人员使用Keras和Tensorflow训练了一个深度神经网络(DNN),使用ECoG数据作为输入,并以录音的声码器/声谱图表示为目标。为了评估结果音频,研究人员让听众听复原数字,并报告他们听到了什么;最佳模型的精度达到75%。

由德国不来梅大学的Tanja Schultz教授领导的另一个研究小组收集了接受颅骨切除术的病人的数据。研究人员向这些患者展示了单个单词,他们大声朗读这些单词,同时记录他们的ECoG信号。语音也被记录下来并转换成声谱图。然后,他们训练了一个密集卷积网络(DenseNet),将大脑信号转换成声谱图。接下来,他们用WaveNet声码器将声谱图转换成可听语音。为了评估合成语音,研究人员使用了一种名为短时目标可懂度(STOI)的算法来测量语音质量。分数介于30%到50%之间。

最后,由加利福尼亚大学的Edward Chang领导的第三个研究小组,也使用了患者大声朗读时记录的ECoG信号数据。该团队使用了两个长短期记忆(LSTM)网络的方法。第一个学习了从大脑信号到“中间关节运动表征”的映射,该映射可以建模说话者声道的物理行为。第二个LSTM学习了从运动表征输出到实际音频的映射。这个模型使研究人员能够从记录的大脑活动中合成语言,而病人只是做出说话的动作,并没有真正发出声音。通过Amazon Mechanical Turk,研究人员让听众在听到一个合成的句子后,从多项选择的答案中选出一个来标识他们听到的句子。正确识别每句话的听众的中位数百分比是83%。

要使这项技术成为一种实用的假肢,还有很长的路要走。首先,所有的方法都使用了收集到的电极数据,这些电极被植入那些头骨被打开进行脑部手术的病人的大脑中。虽然Chang的团队确实证明了无声哑剧所产生的信号可以合成语音,但是,许多可能需要这种假肢的使用者可能无法很好地控制他们的声道,甚至无法做到这一点。

查看英文原文:Deep Learning for Speech Synthesis of Audio from Brain Activity

利用深度学习从大脑活动合成语言,应对人类语音挑战相关推荐

  1. 【自动驾驶】如何利用深度学习搭建一个最简单的无人驾驶系统

                                                 新智驾按:本文为新智驾独家专栏,作者系佐思产研研究总监周彦武,新智驾经授权发布. 国内最牛的无人驾驶厂家的运算 ...

  2. 利用深度学习(Keras)进行癫痫分类-Python案例

    目录 癫痫介绍 数据集 Keras深度学习案例 本分享为脑机学习者Rose整理发表于公众号:脑机接口社区 QQ交流群:903290195 癫痫介绍 癫痫,即俗称"羊癫风",是由多种 ...

  3. DeepMind用深度学习模仿大脑推理,预测编码智能推进一大步!

    [新智元导读]预测编码理论认为,大脑的感知.运动控制.记忆及其他高级功能,取决于真实经历和大脑对未来的预测之间的差异.DeepMind新推出的"生成查询网络"模仿了大脑的预测编码机 ...

  4. AI安全初探——利用深度学习检测DNS隐蔽通道

    AI安全初探--利用深度学习检测DNS隐蔽通道 目录 AI安全初探--利用深度学习检测DNS隐蔽通道 1.DNS 隐蔽通道简介 2. 算法前的准备工作--数据采集 3. 利用深度学习进行DNS隐蔽通道 ...

  5. 吴恩达 NIPS 2016:利用深度学习开发人工智能应用的基本要点(含唯一的中文版PPT)...

    雷锋网按:为了方便读者学习和收藏,雷锋网(公众号:雷锋网)特地把吴恩达教授在NIPS 2016大会中的PPT做为中文版,由三川和亚峰联合编译并制作. 今日,在第 30 届神经信息处理系统大会(NIPS ...

  6. 文本深度表示模型Word2Vec 简介 Word2vec 是 Google 在 2013 年年中开源的一款将词表征为实数值向量的高效工具, 其利用深度学习的思想,可以通过训练,把对文本内容的处理简

    文本深度表示模型Word2Vec 简介 Word2vec 是 Google 在 2013 年年中开源的一款将词表征为实数值向量的高效工具, 其利用深度学习的思想,可以通过训练,把对文本内容的处理简化为 ...

  7. (四十五:2021.08.05)《利用深度学习对ecg信号进行分割》

    <Deep Learning for ECG Segmentation><利用深度学习对ecg信号进行分割> 讲在前面 摘要 1. 介绍 2. 算法 2.1 预处理 2.2 神 ...

  8. 基于深度学习的大脑性别差异分析

    点击上方蓝字关注我们 基于深度学习的大脑性别差异分析 温景熙, 于胡飞, 辛江, 唐艳 中南大学计算机学院,湖南 长沙 410083 摘要:深度学习被广泛应用于大脑的相关研究中.通过构建深度学习模型对 ...

  9. 【转】利用深度学习检测DNS隐蔽通道

    原文连接:AI安全初探--利用深度学习检测DNS隐蔽通道 - bonelee - 博客园 AI安全初探--利用深度学习检测DNS隐蔽通道 目录 AI安全初探--利用深度学习检测DNS隐蔽通道 1.DN ...

最新文章

  1. php.ini 米拓_图片无法上传问题“大集结”-米拓建站帮助中心
  2. 漫谈强化学习中的引导搜索策略
  3. 04_关于元数据,ResultSetMetaData对象以及API方法介绍
  4. pytorch实现人脸识别_一步一步带你完成深度学习与对象检测之人脸识别
  5. ClassNotFoundException:是否会减慢您的JVM?
  6. Spring Data JPA 从入门到精通~@Modifying修改查询
  7. 计算机it岗考试试题,计算机IT职称考试试题及其答案.doc
  8. 建立一个中文名字的文件夹Python
  9. Web安全与Rational AppScan入门
  10. clousx6机器人怎么导入词库_clousx6
  11. Android EditText监测(TextWatcher)输入后延时500ms再搜索
  12. 2021-09-13 《鸟叔Linux私房菜》阅读纪录 第一章-Linux是什么如何学习-Linux 是什么Torvalds的Linux 发展
  13. 《你的灯亮着吗?》 读后感
  14. unity3d中如何把对象存进数组
  15. 洛雪音乐助手 0.18.2 — 音乐下载工具
  16. html怎么调用node.js,nodejs如何调用函数?
  17. MATLAB修改证件照背景
  18. 海森堡量子力学与计算机,量子力学诞生后的120年,没有人真正懂他
  19. 广为流传的一个关于项目管理的通俗讲解
  20. JavaOOP 面试题

热门文章

  1. 西瓜书+实战+吴恩达机器学习(四)监督学习之线性回归 Linear Regression
  2. 《废柴》系列 - What?废柴,你不会下载Google浏览器插件,Are you kidding???
  3. error: cannot read: aaa.java_Java期末考试习题库[选择题填空题改错题学生].doc
  4. [Ext JS] Grid 的复选框行选择之——某些行不能选取
  5. DQL 学习3 -- Administration Methods
  6. [设计模式-结构型]桥接(Bridge )
  7. linux 文件字典排序,linux - 强制linux排序使用字典顺序 - 堆栈内存溢出
  8. pgsql 筛选中文字符正则_PostgreSQL正则及模糊查询优化
  9. Soul 网关源码阅读(四)Dubbo请求概览
  10. 如何保留小数点后任意一位数