SpeechIO TIOBE

ASR Benchmark

滚动测试报告 2021年10月

1、更新日志

最新更新日期:2021-10

  • 2021年10月:

    • 场景:增加 [电台节目:张震鬼故事] [华语大学生辩论赛] [同声传译现场 时政]

    • 流程:TN模块增加无意义 filler 词 "呃,啊" 过滤

    • 测试:全厂商 × 全场景 滚动刷新测试

  • 2021年7月:

    • 场景:增加 [短视频-产品开箱] [短视频-农业种植] [线下培训-古希腊哲学]

    • 测试:全厂商 × 全场景 滚动刷新测试

  • 2021年4月:

    • 发布:Leaderboard 项目

    • 场景:增加 [汽车之家-汽车评测] [小艾大叔-豪宅带看]

    • 测试:全厂商 × 全场景 滚动刷新测试

  • 2021年1月:

    • 场景:增加[体育赛事解说-NBA] [纪录片-篮球人物]

    • 厂商:得到"创业公司S"授权,身份公布为思必驰AISpeech,调用平台为[思必驰开放平台-一句话识别服务]

    • 测试:全厂商 × 全场景 滚动刷新测试

  • 2020年12月:

    • 场景:增加 [少儿卡通 小猪佩奇&熊出没]

    • 厂商:百度服务切换至极速版,详见 [百度服务切换说明]

    • 测试:全厂商 × 全场景 滚动刷新测试

  • 2020年11月:

    • 场景:增加 [评书 单田芳-白眉大侠],[相声 德云社],[脱口秀 吐槽大会]

    • 测试:全厂商 × 全场景 滚动刷新测试

  • 2020年10月:

    • 指标:增加 SOTA 数值 ,详见 [当我们谈论SOTA时,我们在谈论什么]

    • 场景:增加 [短视频 电影剪辑 谷阿莫&牛叔说电影] [短视频 美食&烹饪 琼斯爱生活&贫穷料理]

    • 测试集发布:[新闻联播] 测试集已公开发布,后续滚动测试不会每期都覆盖该场景

    • 测试:全厂商 × 全场景 滚动刷新测试

  • 2020年9月:

    • 场景:增加 [在线教育 罗翔 法考] [在线教育 张雪峰 考研]

    • 厂商:[阿里云+]已上线合并入公网版本[阿里云],TIOBE 历史数据记录始终以公网版本为准。

    • 测试:全厂商 × 全场景 滚动刷新测试

  • 2020年8月:

    • 场景:增加 [播客 创业内幕]

    • 测试:全厂商 × 全场景 滚动刷新测试

  • 2020年7月:

    • 场景:增加 [播客 故事FM]

    • 重要修复:发现 [直播带货 李佳琪薇娅] [直播王者荣耀 张大仙骚白] [老罗语录] 三个场景测试集标注错误,全面检查&修正;作废这三个测试集6月的测试结果,7月开始启用修正后的测试集。详情见本月已经发布的[更正说明文章]

    • 测试:全厂商 × 全场景 滚动刷新测试

  • 2020年6月:

    • 场景:增加 [直播带货 李佳琪薇娅] [直播王者荣耀 张大仙骚白] [老罗语录]

    • 厂商:增加 阿里+ ,为阿里云新算法的试用版; 测试中取消[谷歌], 因谷歌的中文识别性能没有参考性,且费用超过其余各家之和。

    • 更名:原搜狗知音平台 改名为 搜狗AI开放平台

    • 测试:全厂商 × 全场景 滚动刷新测试

  • 2020年5月:

    • 修复搜狗多句结果解析bug

    • 场景:增加 [天下足球-世界杯往事] [罗振宇跨年演讲] [李永乐老师在线讲堂]

    • 厂商:增加 创S

    • 测试:全厂商 × 全场景 滚动刷新测试

  • 2020年4月:

    • 场景:增加 [鲁豫有约大咖一日行]

    • 厂商:增加 微软 Azure 认知服务 搜狗知音平台

    • 测试:全厂商 × 全场景 滚动刷新测试

  • 2020年3月:

    • 项目发布:[引篇] [测试规范]

    • 场景:增加 [新闻联播]

    • 厂商:增加 阿里 百度 谷歌 讯飞 腾讯 创Y

2、滚动测试

已有测试集信息汇总

文章链接 场景 领域 难度(1-5)
新闻联播 新闻播报 时政
鲁豫有约一日行 访谈电视节目 名人工作、生活 ★★☆
天下足球 专题电视节目 足球 ★★☆
罗振宇跨年 会场演讲 社会、人文、商业 ★★
李永乐讲堂 在线教育 科普 ★★★
直播 王者荣耀 直播 游戏 ★★★☆
直播 带货 直播 电商、美妆 ★★★★☆
老罗语录 线下培训 段子,做人 ★★★★☆
播客 故事FM 播客 人生故事、见闻 ★★☆
播客 创业内幕 播客 创业、产品、投资 ★★☆
罗翔 法考 在线教育 法律 法考 ★★☆
张雪峰 考研 在线教育 考研 高校报考 ★★★☆
谷阿莫&牛叔 短视频 电影剪辑 ★★★
琼斯爱生活&贫穷料理 短视频 美食、烹饪 ★★★☆
单田芳-白眉大侠 评书 江湖、武侠 ★★☆
德云社专场 相声 包袱段子 ★★★
吐槽大会 脱口秀 明星糗事 ★★☆
小猪佩奇&熊出没 少儿动画 童话故事、日常 ★☆
NBA现场转播 体育赛事解说 篮球,NBA ★★★
篮球人物 纪录片 篮球明星,成长 ★★
汽车之家 汽车评测 短视频 汽车品牌,车型,路测 ★★★☆
小艾大叔 豪宅带看 短视频 房地产,豪宅 ★★★☆
Zealer & 无聊开箱 短视频 产品开箱 ★★★
付老师种植技术 短视频 农业种植 ★★★☆
石国鹏线下课 线下培训 古希腊哲学 ★★☆
张震鬼故事 电台节目 恐怖故事 ★★★
华语大学生辩论赛 辩论赛 兴趣,技能,成长 ★★★
同声传译 同声传译现场 时政 ★★★☆

最新滚动测试结果汇总

纵轴(字准确率%)绘制范围为 [70, 100]

(注:讯飞被低估,原因详见链接 [SOTA])

最新滚动测试详细数据

3、简评

  • 本季度新加入 [张震鬼故事] [大学生辩论赛] [同声传译现场] 场景测试。

  • 本季度测试流程中的TN模块加入了无意义 filler 词 “呃,啊”的过滤,各厂商数字会因此有少许提升。

  • 本次滚动测试,阿里的调用更新到公网最新版“拾音石”,在 SpeechIO 测试集上性能全面下滑。其它厂商服务无明显变化。

  • 自本期滚动测试开始,SpeechIO 在有精力的前提下尽量做到每期都全面更换调用账号。

语音之家SOTA | TIOBE 滚动测试报 2021.10相关推荐

  1. 语音之家SOTA | TIOBE 场景测试:电台节目 张震鬼故事

    SpeechIO TIOBE Benchmark 场景测试:电台节目 张震鬼故事 1.素材来源 YouTube 抓取"张震鬼故事" 往期节目,原始音频约3小时 2.场景特点 环境 ...

  2. 语音之家SOTA | 同声传译现场 时政

    SpeechIO TIOBE Benchmark 场景测试:同声传译现场 时政 1.素材来源 YouTube 爬取美联储.白宫发布会.政要座谈会等时政素材的中文同传现场,原始时长约两个半小时. 场景上 ...

  3. 语音之家SOTA|Leaderboard 新增 WenetSpeech 数据集预训练 WeNet 模型

    Leaderboard 项目新增基于 WenetSpeech 数据集的 WeNet 预训练模型,识别准确率如下: 具体数字如下: 该模型可与之前发布的开源测试集配合使用,进行本地复现和验证,模型的下载 ...

  4. 语音之家SOTA|开源发布: SPEECHIO_ASR_ZH00004 罗振宇跨年演讲

    本期开源发布为 [罗振宇跨年演讲] 场景,测试集ID: SPEECHIO_ASR_ZH00004 获取方式: 平台:Linux / MacOS Step 1 获取 leaderboard 代码仓库: ...

  5. 助力AI语音开发者的社区-语音之家

    语音之家简介 语音之家成立于2021年4月,是一家助力AI语音开发者的社区,我们希望通过知识传播.在线学习.资源分享.各类活动等方式提供全生命周期的服务,帮助全球的AI语音开发者获得成长,洞见AI语音 ...

  6. Xamarin.iOS真机测试报错

    Xamarin.iOS真机测试报错 错误信息:The MinimumOSVersion inside Info.plist does not include the device version(er ...

  7. Xamarin Android真机测试报错

    Xamarin Android真机测试报错 Xamarin Android真机测试报错,错误信息为INSTALL_CANCELLED_BY_USER.出现这个错误,通常都是真机上开发者选项设置错误.由 ...

  8. 【GitLab】gitlab上配置webhook后,点击测试报错:Requests to the local network are not allowed...

    gitlab上配置webhook后,点击测试报错: Requests to the local network are not allowed 操作如下: 报错: 错误原因: gitlab 10.6 ...

  9. apache ab压力测试报错apr_socket_recv

    apache ab压力测试报错(apr_socket_recv: Connection reset by peer (104)) apache 自带的ab工具测试,当并发量达到1000多的时候报错如下 ...

  10. 关于activeMq在本地测试报错org.apache.activemq.transport.InactivityIOException: Cannot send, channel has alrea

    关于activeMq在本地测试报错org.apache.activemq.transport.InactivityIOException: Cannot send, channel has alrea ...

最新文章

  1. noteexpress 笔记导出_【在库言库】2019年第7期 科研工具——NoteExpress文献管理软件...
  2. 如何处理高并发情况下的DB插入
  3. Hadoop作业提交分析(三)
  4. mysql 生成时间轴,MYSQL 时间轴数据 获取同一天数据的前3条
  5. [html] 怎样在页面上实现一个圆形的可点击区域?
  6. Springboot集成axis1.4
  7. davinci项目服务器无法,【工程管理】为达芬奇建一个项目管理服务器 多人协同调色...
  8. Dell也来凑热闹,传将数月内发售Android手机Mini 3i
  9. 【IDEA】IDEA 格式化 代码技巧 idea 格式化 会加 <p> 标签
  10. Python ADF 单位根检验 如何查看结果
  11. nexrcloud 自动上传_Nextcloud默认文件的自定义
  12. 酷派大神F1-救砖详细教程! 酷派8297w(大神F1联通版) 恢复官方兼救砖
  13. Python小游戏-Las Vegas Black Jack- CASINO (21点)
  14. 惠普136系列打印机:拆封启动、无线驱动安装、电脑手机打印
  15. opencv 傅立叶变换及其逆变换实例及其理解1
  16. Java 第九次平时作业
  17. 层次分析法python代码_Python 实现层次分析法
  18. bigemap软件功能
  19. 基于Matlab的结点电压法及相关定理验证的人机交互界面!
  20. 研究生如何发表论文 --转自张帅

热门文章

  1. 行业知识图谱调查报告(一):知识图谱概述
  2. Latex多处引用同一脚注
  3. 2018携程校招笔试第二道编程题
  4. Vue地图导航调用百度地图
  5. 支持扫描的单usb口打印服务器,TL-PS110U 单USB口打印服务器
  6. ubuntu 中 vi 编辑文件上下左右删除键毫无作用肿么办!(上上下下左右左右BABA)
  7. 网络技术学习:虚拟专用网络
  8. 多台显示器图像拼接组成大屏幕是怎么实现的?
  9. 阿里腾讯大裁员,中概股暴跌!没病千万别去互联网公司......
  10. 计算机函数求奖学金,Excel函数在高校奖学金评定中的实践应用参考.pdf