Facebook发布神经蛋分离法,可从嘈杂环境中提取音视频
分离混合分布是机器学习和信号处理的长期挑战,而Facebook近日提出的新方法似乎可以有效解决这一难题。
人类天生善于分离个别声音和视觉效果,例如在拥挤的鸡尾酒会上听到别人的声音,或者在动物穿过灌木丛时发现动物。但依赖于机器学习的应用程序通常很难完成这项任务。解决这一问题的监督方法,包括对每个来源的样本进行培训,以及假定大量的训练数据都不一定能取得很好的效果,完全无监督的方法会使模型对混合信号源做出不准确的假设。
于是Facebook的研究人员提出了神经蛋分离法(Neural Egg Separation,简称NES),据官方解释,这一方法的命名灵感来源于鸡蛋,意思是像分离蛋清和蛋黄一样把清晰的音视频从模糊的信号中提取出来。
这是一种半监督方法,结合了训练和估计的各个方面。在这一迭代方法中,系统通过将信号混合在一起并进行多个分析来分离已知和未知分布。在此过程中,系统逐渐将更多已知信号注入混合信号中,同时模型在隔离和提取时不断改进。实验表明,NES明显优于采用类似监督的其他方法,即使对使用全面监督的系统,NES方法也具有竞争力。
除了改善ML系统在逼真的杂乱和嘈杂条件下理解音频和视觉输入的能力之外,这种方法还可以通过应用增强人们隔离信号的自然能力。比如,可以应用在音乐会(或类似场景)中的音频、视频记录,或者开发基于AR的应用,用来实时放大特定音频源或视觉特征。
论文地址:
https://research.fb.com/publications/neural-separation-of-observed-and-unobserved-distributions/
Facebook发布神经蛋分离法,可从嘈杂环境中提取音视频相关推荐
- 说人话,搜代码,Facebook发布神经代码搜索数据集+benchmark
郭一璞 发自 中关村 量子位 报道 | 公众号 QbitAI 怎么才能方便的找自己需要的代码? 最好是能用人话来直接搜索.说什么就给什么那种. Facebook刚刚发布了新benchmark和数据集, ...
- 手把手教你自己写一个Python模块,并将其发布并安装到自己的Python环境中去
首先得说明一点,python的模块就是有一些.py文件所构成的,所以要想写一个模块,自己得先写一些python程序,我这里就写一个module1.py 1.接下来,就是先建立一个文件夹my_packa ...
- Linux环境中Qt程序的手工发布
Qt 5.7.0 编写的程序需要部署到一台没有安装Qt的目标机器上,程序采用C++与QML混合编程,QML做界面,C++写逻辑. 环境说明 开发环境 Ubuntu 16.04.1 LTS 运行环 ...
- Facebook发布AR眼镜研究项目Project Aria
Facebook 来源:IEEE电气电子工程师 近日,在Oculus Connect直播活动中,Facebook宣布了Aria项目,这是一个专注于构建可穿戴增强现实设备的研究项目.但这些智能眼镜更像是 ...
- 端到端对话模型新突破!Facebook发布大规模个性化对话数据库
作者|Pierre-Emmanuel Mazare 等 译者|郝毅 编辑|Debra 出处丨 AI 前线 AI 前线导读:聊天机器人是目前非常流行的一种人工智能系统.目前大部分聊天机器人的衔接性都不是 ...
- Facebook发布Detectron2,下一个万星目标检测新框架
作者 | CV君 来源 | 我爱计算机视觉(ID:aicvml) Detectron是Facebook于2018年发布的专注于目标检测的深度学习框架,基于Caffe2深度学习框架,实现了众多state ...
- Facebook发布人工智能产品DeepText:能以人类智商
Facebook发布人工智能产品DeepText:能以人类智商 智能界网2016-06-02 11:01:21 人工智能 智能 信息 阅读(3168)评论(0) 在不久前的开发大会上,Facebook ...
- 效率达CPU一万倍、内含800万神经元:英特尔发布神经形态芯片超算
效率达CPU一万倍.内含800万神经元:英特尔发布神经形态芯片超算 人类大脑由 860 亿个互相连接的神经元组成,英特尔最近推出的类脑芯片系统 Pohoiki Beach 向「模拟大脑」这一目标前进了 ...
- 【历史上的今天】6 月 18 日:京东诞生;网店平台 Etsy 成立;Facebook 发布 Libra 白皮书
整理 | 王启隆 透过「历史上的今天」,从过去看未来,从现在亦可以改变未来. 今天是 2022 年 6 月 18 日,在 2007 年的今天,优酷已经与迅雷达成合作,迅雷将获得更多视频发行版权.优酷与 ...
最新文章
- 架设win2003r2下配置好iis6+php+mysql_WIN2003+IIS6 PHP 5.3.8安装配置教程[图文]
- Ubuntu安装yum失败-2
- html编辑完后扩展名是,【填空题】使用文本编辑器编辑完HTML后,扩展名可以是 或 。...
- DDD理论学习系列(8)-- 应用服务amp;amp;领域服务
- group by 用法解析_GRE数学专项练习及解析概率
- 韵达开放接口php代码,韵达快递订单运输状态查询接口
- CoffeeScript学习(3)—— 函数
- Oracle管理监控之如何对数据库进行监控检查
- DBC连接数据库经验技巧
- 推荐几个设计师常去的优秀素材网站!收藏好哦!
- 1.初识elasticsearch
- Android 自动化操作,辅助功能无障碍,在其他应用的上层显示
- 深职计算机学院官网,深圳职业中专
- c语言自动输入一位数字,c语言:要求输入一个四位整数,然后将各位数字按英文输出...
- Logit-Probit:非线性模型中交互项的边际效应解读
- 播放assets文件里视频文件的问题
- HaaS600物联网开发板学习笔记(三)---使用amp工具远程更新js代码
- 鼠标移到到图片,图片向上滑动预览效果
- Verilog 语法(二)···············简单入门
- php 富文本编辑器 UEditor 的使用,参数配置(保存图片路径)