自2020年开始,COVID-19几乎颠覆了我们的生活方式。全球线上办公、线上教学人员比例大幅度上升。

Facebook CEO马克·扎克伯格在召开在线员工大会时表示,Facebook将花5-10年的时间让半数员工实现永久远程办公。扎克伯格称,Facebook员工调查的数据显示,20%员工对疫情隔离措施解除后保持完全远程办公“非常感兴趣”,另外20%员工对这一选项“有些兴趣”,绝大多数员工希望能有更多的工作地点灵活性。

新冠肺炎的盛行成为了face-to-face meeting/working到online office/class的重大转折点。线上会议语音助手是线上会议/教学最大的应用,相比于普通的语音识别应用场景,线上会议场景语音识别存在更多的挑战。

由于线上会议或者线上教学上课,都是在家居环境中进行,家居噪声、设备多样化、多语种的混杂、网络延迟或者设备性能等影响,都会给实时语音识别、转录等带来很多的挑战。

1. 生活背景噪声的干扰

由于大家都是居家状态,孩子在家上网课,家长在家办公,所有人共处一栋房子,很容易产生相互干扰的噪声。无论是来自同一个家庭还是周围的环境,多个扬声器和噪音的背景喧嚣阻碍了视频或音频会议期间的沟通能力,在汽车上、手机上或与数字语音助理交谈时也有同样痛点。此外,家庭中儿童声音、语言和经常不稳定的行为比成人更加复杂多变。语音识别设备需要考虑到儿童的语言模式、语言结构和声调(随着年龄的增长会有很大的变化)等变量,更不用说句法、语法和发音等问题。

2. 混合语种切换

由于全球化的发展,人类实际日常交流中经常会有中文语境下英文单词夹杂的现象,这在学术上称为语种混杂(Code-switch),是当前语音识别技术面临的重要挑战之一。其技术难点主要表现为:嵌入语受主体语影响形成的非母语口音现象严重、不同语言音素构成之间的差异给混合声学建模带来巨大困难、带标注的混合语音训练数据极其稀缺。

3. 实时语音转录的困难

学生在线参与网课或者工作人员线上开会,都不如面对面上课或者开会时精力集中。因此实时的线上会议转写,做好会议提纲转录,是目前线上会议的刚需。实时转写不仅涉及实时性问题还有说话人日志和语音分离等困难,如果讨论激烈,或者背景声中有其他人的干扰声,这些任务的难度会更大。

任何基于深度学习的语音识别相关的任务都离不开数据的支撑。数据是深度学习的基石,而会议场景数据是解决会议场景语音识别相关挑战的基石。针对会议场景的语音识别相关任务,可以从相关场景数据录制和多任务算法集成框架方面落地实施。

1. 真实会议场景数据以及多语种语料库采集

深度学习相应场景问题导致的域的不匹配引发的语音识别准确率降低,都可以归结为数据的缺乏。以数据驱动会议场景语音识别的落地,是目前最为成熟、稳定的方案。数据驱动的技术路线也意味着对数据和计算的更高需求,例如以前需要几千数据跑出的结果,现在可能需要几万数据。

但是大量数据的采集会占用大量的人力、物力、资源。算法工程师的主要任务是研究算法,采集数据这样专业的事情就需要找专业的数据公司来做,作为全球领先的AI数据解决方案提供商,Magic Data致力于提供高质量的数据采集,数据垂类划分清晰,数据清洗仔细。针对商务场景,拥有多语种、多噪声的语音库。

2. 研究多任务算法集成框架

智能会议场景的语音识别主要涉及:说话人日志、语音分离、语音增强和语音识别模块,每个模块目前大部分研究工作都是分开训练,上线时在策略上进行集成。由于单独优化,就存在局部最优的问题,无法实现多个模块的整体最优,是学术界和工业界目前努力的方向。同时由于实时性的要求,也需要算法模型更小、更精准。但算法的研究还是要基于现有数据,目前有些论文基于模拟数据,不具备真实数据的特点,实际落地仍然会有差距。鉴于此,Magic Data为科研工作者提供用于研究特定会议场景的语音数据库。

未来语音科技发展的助推剂是数据,而高质量数据决定了算法工程师能够造出真正具有竞争力的产品。Magic Data(北京爱数智慧科技有限公司)将通过专业的数据服务团队,持续为算法工程师输送高质量的数据“原油”。

行业洞察 | 在家办公or上课,你的线上会议小助手听话吗?相关推荐

  1. 全员在家办公的小微企业,该怎么度过?

    大疫第三年,众生皆苦. 在中国--庞大的人口基数导致任何一个防疫政策波动和细分行业变动,都会牵扯到数千万的家庭.大疫第三年,小微企业过得很苦. 随着防疫政策,按下暂停键,似乎预示着很多事情开始变得愈发 ...

  2. 疫情之下「在家办公模式」开启,你该选择哪些远程协同工具?| 特稿

    作者 | Aholiab 责编 | 胡巍巍 出品 | CSDN(ID:CSDNnews) 随着抗击新型冠状病毒感染疫情的不断深入,中国的应对举措受到了国际社会的高度关注.周密部署.亲临一线.精诚团结, ...

  3. 推特微软允许员工永久在家办公,企业如何应对远程办公常态化发展

    就在今年的10月10号微软发布了一则通知,将允许员工有不超过50%的工作时间选择在家办公,经过批准之后,也可以永久在家远程工作. 这是今年5月份继twitter宣布允许员工在家工作外.又一家巨头公司, ...

  4. 疫情之下「在家办公模式」开启,你该选择哪些远程协同工具?

    作者 | Aholiab 编辑 | 胡巍巍 来源 | CSDN(ID:CSDNnews) 随着抗击新型冠状病毒感染疫情的不断深入,中国的应对举措受到了国际社会的高度关注.周密部署.亲临一线.精诚团结, ...

  5. 从线上教育的如火如荼,反思传统培训行业的未来发展

    最近好像只要一沾上"线上教育"四个字的培训课程就一定很火.周未去听一个技术分享沙龙.得知,现在的北京VC圈,只要你是从国外回来,只要你说要做线上教育,就会有VC向你砸钱!在想,现在 ...

  6. 飞书推出“线上办公室” 通过实时语音频道还原办公场景

    为解决企业远程协作办公痛点,2月2日,字节跳动旗下办公套件飞书宣布推出"线上办公室"功能,通过实时语音频道的方式,高度还原办公室工作.沟通场景,帮助企业和团队之间提升远程协作效率, ...

  7. 中国线上超市行业营销态势与投资盈利预测报告(2022-2027)

    中国线上超市行业营销态势与投资盈利预测报告(2022-2027) **************************************** [报告编号]: BG420767 [出版时间]: 2 ...

  8. 在家办公上课成强需求 钉钉峰值流量暴增百倍

    根据公开信息显示,2月12日,钉钉已连续在苹果应用商店霸榜7天.据悉,春节以来,在家办公及在家上课的强需求,使得钉钉后台系统峰值流量暴增百倍.钉钉通过阿里云连续扩容10万台云服务器,抗住了这一巨大的流 ...

  9. 微软允许永久在家办公后,发现微软像极了“微商”!

    社交电商创业 丨作者 / 小辉   整理 /  小饼 小小光辉,照你战斗 没有low的行业,只有low的人 正是无人监督下的自律,成就万众瞩目的掌声 --序 前几天,微软公布了一项公司新规定:允许员工 ...

最新文章

  1. 2021全球产品经理大会蓄势待发!
  2. java applog_java - 通过Logback登录到App Engine request_log - SO中文参考 - www.soinside.com
  3. 江西工业职业技术学院计算机专业在哪个校区,江西工业职业技术学院几个校区...
  4. 你了解HTTPS,但你可能不了解X.509
  5. 猜数字游戏的提示 (Master-Mind Hints, UVa 340)
  6. 传言阿里P10赵海平,被P11多隆打3.25后离职,如何评价赵海平对王垠的面试?
  7. 求一元硬币兑换成1分、2分、5分的硬币的兑换方案
  8. 初识Java,探索神秘的它
  9. 春季必买明星款流行春装
  10. HTML+CSS练习——实现京东登录静态页面
  11. 普通人跨考浙大计算机的经验贴(2019)
  12. APP产品经理(一)
  13. self和[self class]
  14. 刷屏的Google Pay:羊毛是你的,你是我的
  15. Mac OS下Charles抓包小程序的保姆级操作过程
  16. Reliable Cloud Infrastructure: Design and Process学习笔记
  17. 微信小程序 原生开发 实现弹窗遮罩层 并且在遮罩层内使用scroll-view实现滚动内容(包括图片)
  18. ThinkPHP3.2 框架sql注入漏洞分析(2018-08-23)
  19. iOS开发——项目篇—高仿百思不得姐
  20. 合并两个有序链表(java算法)

热门文章

  1. vue 中 Promise 使用方法
  2. 重装上阵怎么造简便机器人_重装上阵怎么做机器人 机器人制造技巧讲解
  3. Ruoyi-Vue 自定义跳转页面
  4. Oracle创建新用户
  5. oracle给用户sys权限,oracle创建用户并赋予sys角色权限
  6. Access用OleDbParameter无法更新数据解决方案
  7. StopWatch类
  8. TX2进入Recover恢复模式
  9. 索尼手机c6802的Android,索尼C6802 (Xperia UL)图文刷机教程,最新教程,简单明了
  10. Linux搭建求生之路2服务器端之CentOS