金磊 发自 凹非寺
量子位 | 公众号 QbitAI

这,或许是现在跟Siri交流最潮的方式了——

只需要动动嘴皮子,就能让它under你的control。

没错,就是不需要出任何声音的那种。

这就是来自康奈尔华人团队的最新研究成果 SpeeChin,无声语音识别。

像这样:

在没有声音的情况下,你能猜出来他在说什么吗(文末揭晓答案)?

但在SpeeChin的加持下,现在的Siri、Alexa等就已经可以识别,而且还支持普通话和英文!

是有种“此时无声胜似有声”的感觉了。

不说话,怎么控制语音助手?

康奈尔团队研发的SpeeChin,其实是一条神奇的项链

戴上这条项链,就能开启无声语音控制的大门了。

例如对着电脑默念一句“Next”,音乐就会自动切换成下一首歌:

或许你会说一个单词过于简单了,别急,现在就来加大难度:

“Switch to Taylor Swift.”

可见,SpeeChin即便是面对一句完整的话术,也可以做到精准识别。

而这条“无声识别”项链的关键,就在于安装在项链下方的红外摄像机

它可以捕捉到人物颈部和面部皮肤的变形图像,从而进行分析识别工作,确定从“嘴皮子”传达的是什么命令。

而且这条项链不仅能无声识别英文,连中文 (普通话)也能够hold住。

在最初的实验中,有20人参与到了测试中,其中10人讲英文,另外10人说普通话。

研究人员让测试者分别用英文和中文发出数十条指令,包括数字、互动指令、语音辅助指令、标点指令和导航指令。

最后的实验结果,“无声识别”的准确率分别达到了90.5%91.6%

来自康奈尔大学的华人团队

这项研究来自康奈尔大学,一作是Ruidong Zhang。

其中,Cheng Zhang是这项研究的通讯作者。

他是康奈尔大学信息科学系的助理教授,他的研究聚焦在如何获取人体及其周围的信息,以应对各种应用领域中的现实世界挑战,如交互、健康感知和活动识别。

研究的一作Ruidong Zhang,他是Cheng Zhang教授的一名博士生,本科毕业于清华大学。

他的研究兴趣在于人机交互和普适计算(ubiquitous computing),特别是建立新型的可穿戴设备,用来促进互动体验并加深我们对人类行为的理解。

至于为什么他们要做SpeeChin这项工作,据Ruidong Zhang解释:

主要是考虑到在某些特定场合中,人们可能不适合发出声音;还考虑到一些不能说话的人群。

最后,来揭晓一下开头GIF的答案:

你猜对了吗?

参考链接:

[1]https://techxplore.com/news/2022-02-smart-necklace-silent-english-mandarin.html
[2]https://www.youtube.com/watch?v=pDf86dSPYYI
[3]https://infosci.cornell.edu/content/zhang-0
[4]https://infosci.cornell.edu/content/zhang-1

不出声也能命令Siri!康奈尔大学华人团队开发无声语言识别项链,中文英文都行...相关推荐

  1. 美国康奈尔大学BioNB441元胞自动机MATLAB应用

    美国康奈尔大学BioNB441在Matlab中的元胞自动机 介绍 元胞自动机(CA)是用于计算计划利用当地的规则和本地通信.普遍CA定义一个网格,网格上的每个点代表一个有限数量的状态中的细胞.过渡规则 ...

  2. Cell:康奈尔大学郭春君组开发针对非模式肠道细菌的基因编辑工具

    北京时间2022年1月20日凌晨0时,美国康奈尔大学威尔康奈尔医学院郭春君(Chun-Jun Guo)研究组在<细胞>(Cell)上在线发表题为"Genetic manipula ...

  3. 美国康奈尔大学计算机科学的教授,美国康奈尔大学教授Robbert van Renesse访问并做学术报告...

    美国康奈尔大学教授Robbert van Renesse于10月20日访问信息存储及应用实验室,并在下午武汉光电国家实验室A101带来了一场精彩的学术报告.Robbert教授带来了题为"Bi ...

  4. 康奈尔大学王飞博士:AI处理医疗数据面临的8大挑战

    康奈尔大学王飞博士:AI处理医疗数据面临的8大挑战 本文作者:张利 2017-07-26 21:32 导语:数据质量.数据量.数据标准-- 雷锋网按:本文转自HC3i中国数字医疗网,作者王飞博士,他是 ...

  5. matlab 检测gpu,康奈尔大学使用MATLAB进行GPU性能测试

    [IT168 专稿]康奈尔大学高级计算中心(CAC)宣布正在同NVIDIA.Dell以及MathWorks合作,在新研究中使用MATLAB程序对通用GPU进行性能测试. 该研究将在NVIDIA GPU ...

  6. ICCV2021 Oral-新任务!新数据集!康奈尔大学提出了类似VG但又不是VG的PVG任务

    关注公众号,发现CV技术之美 本文分享收录于 ICCV2021 Oral 的一篇论文『Who's Waldo? Linking People Across Text and Images』,在本文中, ...

  7. 康奈尔大学研究员发现“代码投毒”攻击,可触发供应链攻击

     聚焦源代码安全,网罗国内外最新资讯! 编译:代码卫士 专栏·供应链安全 数字化时代,软件无处不在.软件如同社会中的"虚拟人",已经成为支撑社会正常运转的最基本元素之一,软件的安全 ...

  8. 干货| 美国康奈尔大学博士生——王彦邦

    点击蓝字 关注我们 AI TIME欢迎每一位AI爱好者的加入! 在现实世界中,许多动态系统都可以抽象为时序网络,这些网络通常按照某些规律发展,比如在社会网络中普遍存在的Triadic closure. ...

  9. 学计算机做纸质笔记,详细图文教你康奈尔大学推荐的超级笔记法,只要一张A4纸张,你也可以做学霸...

    本文经"大J小D"(ID:jiayoubaobao2015)授权转载,原标题<一张A4纸,大家都能成为学霸 | 超级笔记法>,作者:大J,未经允许请勿转载. 上周在北京 ...

最新文章

  1. was服务器编码修改,两种was容器下应用乱码问题的解决方案.doc
  2. textview 背景变形_西安昆明池桁架舞台背景搭建欢迎致电
  3. 小蚂蚁学习Redis笔记(13)——Redis之phpredis的安装
  4. c语言编译器储存有什么用,C编译器怎么样对内存划分和使用
  5. 写html前端代码的软件_你能看懂高贵的前端程序员的工作内容?
  6. matlab zxing ean13,【zxing】Ean13 Contents do not pass checksum
  7. 大规模虚拟化,舍我其谁?
  8. 软件测试-缺陷报告(自己看)
  9. 机器人操作系统 ROS 大全
  10. java中正则验证邮箱手机格式
  11. 如何卸载CAD 2019 ?怎么把AutoCAD 2019彻底卸载删除干净重新安装的方法【转载】
  12. 计算机组成原理74138译码器连接,74138(74138译码器工作原理)
  13. 转 网页游戏外挂的设计与编写:QQ摩天大楼3
  14. CSS4day(圆角边框,阴影,浮动详解及其示例)
  15. excel两个指标相关性分析_用Excel做相关性分析方法
  16. PyTorch深度学习(18)网络结构LeNet、AlexNet
  17. 825. Friends Of Appropriate Ages**
  18. 工业品微营销时代_做网络营销_原创有价值的文章更容易带来流量 上海添力
  19. Reverse Attention的代码理解
  20. 手机回收网迅速兴起,闲置手机快速变现有看点

热门文章

  1. sublime_REPL使用及安装教程(解决Sublime无交互问题)
  2. 容器退出时我丢失了数据
  3. 为什么(#39;b#39;+#39;a#39;+ +#39;a#39;+#39;a#39;)。toLowerCase()#39;banana#39;的结果?
  4. 如何获取mongodb中的最后N条记录?
  5. __name__ ==“ __main__”怎么办?
  6. COMP0037 Coursework Investigating Path Planning Algorithms
  7. 第15章 MiniVGGNet:更深的CNNs
  8. [Winform]检测exe是否已经运行,并将其置顶
  9. 人人出售56不亏:三方得利
  10. Android分辨率适配layout布局的问题