近年来,语音识别和语音合成技术各项性能取得显著进步,开始从实验室走向实际场景化应用,进入家居、车载、医疗、教育、移动设备等各个领域,成为智能语音平台服务和硬件终端的核心基础支撑。2019年,中国人工智能产业发展联盟AIIA(以下简称“联盟”)评估组开展了中文语音识别和语音合成可信评估系列工作,立项讨论并发布相应评估规范,共有四家企业参与首轮中文语音合成可信评估并获得证书,在质量基准度、定制相似度和场景表现力都表现突出,总体在7分以上(满分10分)。

可信评估依据联盟已发布的《中文语音识别基础服务指标评估规范AIIAPG 0025-2020》《中文语音合成基础服务指标评估规范AIIAPG 009-2020》,评估规范充分贴近实际应用情况,考虑不同场景中环境、领域等因素,从用户角度出发总结相应评估指标和方法。为进一步推进语音识别和语音合成技术应用水平,增强用户对产品选择可信度,向采购方提供优质服务参考标准,联盟将开展中文语音识别基础服务和中文语音合成基础服务可信评估工作。企业可依照产品实际情况选择必要的测试指标项,通过多维度评估测试验证技术服务能力。

欢迎各单位积极报名参与!

一、评估项目

中文语音识别基础服务第一轮可信评估

中文语音合成基础服务第二轮可信评估

二、参考规范

《中文语音识别基础服务指标评估规范AIIAPG 0025-2020》

《中文语音合成基础服务指标评估规范AIIAPG 0009-2020》

三、评估步骤

1、商务确认:自通知发布起之日,请有意参评的企业可填写《中文语音识别基础服务指标参评需求表》和《中文语音合成基础服务参评需求表》,并发送至联系人邮箱,与联系人确认商务流程后即可参与测试工作。(点击“阅读原文”下载参评需求表,或复制文章链接下载。)

联系人:李荪18611353631 lisun@caict.ac.cn;张秋显18361297790  zhangqiuxian@ngai.ac.cn。

2、材料审查和技术测试:预计6月15日前完成所有参评企业测试工作。

3、专家评审会:拟将邀请相关技术专家对此次评估测试结果进行评审,评审会预计于6月15日至30日期间进行。

4、成果发布:通过专家评审的参评单位,可获得联盟颁发的相应证书。

参评需求表下载地址:

《中文语音识别基础服务指标参评需求表》

http://aiiaorg.cn/uploadfile/2020/0416/20200416035214720.xlsx

《中文语音合成基础服务参评需求表》

http://aiiaorg.cn/uploadfile/2020/0416/20200416035309387.xlsx

01

中文语音识别基础服务可信评估简介

一、评估对象

面向中文语音识别基础服务(在线/离线)

二、评估方法

评估将按照语音识别的评测方法,立足产品应用实际场景,就语音识别服务的基础识别能力扩展识别能力,从以下维度进行综合评估:通用基础识别,选取大样本测试集,评测语音识别的字准确率和句准确率;环境适应识别,评测在远场、噪声环境下的识别能力;特定发音识别,评测在特殊发音人和具有环境噪声中服务的的语音识别能力;不同语速识别,评测在快、普通、慢语速下服务的语音识别能力;场景内容识别,评测在电信业务、车载驾驶、医疗健康、语言教育、新闻播报、文娱体育、金融服务、法律庭审、家居服务九大场景中对内容的识别能力;符号数字识别,评测对常用符号数字的识别能力;采样率支持,评测是否支撑多采样率的音频识别;快速定制功能,评测是否支持对特定文本的训练学习;错误纠正功能,评测对包含停顿、拖音、重复、吞字等口语情况音频的纠正能力。

本次中文语音识别服务评测,将依据评估规范中指标项建立不通过的测数据集,就中文语音识别服务返回文本结果,计算识别的字准确率或句准确率,评估方法包括检查和测试两类测评方法,具体如下:

(1)材料检查:测评对象提供系统名称、系统版本号、系统基本描述、系统功能说明、系统软硬件清单、行业实施案例说明、计费方式说明等基本信息,并以文档形式说明。

(2)测试:依据规范评测标准,将测试数据集识别为文本,计算语音识别的字准确率或句准确率。

02

中文语音合成基础服务可信评估简介

一、评估对象

面向中文语音识别基础服务(在线/离线)

二、评估方法

评估将从按照TTS-4S

(Standard.Similarity.Scene.Sevice)评测方法,立足产品应用实际场景,从四个维度进行综合评估:质量基准度,评测合成发音准确、清晰和自然程度;定制相似度,评测个性化音质合成还原相似程度;场景表现力,评测在电信业务、车载驾驶、医疗健康、语言教育、新闻播报、文娱体育、金融服务、法律庭审、家居服务九大场景中场景贴合程度;服务能力,评测系统服务可靠性和安全性。

本次中文语音合成服务评测,将依据评估规范中指标项构建不同测试集,就中文语音合成服务返回音频结果进行综合判定,评估方法包括检查和测试两类测评方法,具体如下:

(1)材料检查:测评对象提供系统名称、系统版本号、系统基本描述、系统功能说明、系统软硬件清单、行业实施案例说明、计费方式说明等基本信息,并以文档形式说明。

(2)测试:人工评测,依据规范评测标准,对合成音频质量进行主观打分,与教育部国家语言文字工作委员会协同完成。

End

防疫控疫显身手 复工复产高效能 | 第二批《“AI+先进制造业”助力疫情防控新技术新产品新服务推荐目录》发布

防疫抗疫战场的城市先行者——人工智能助力新冠疫情防控数据分析

【调研报告】中国人工智能产业发展联盟《人工智能助力新冠疫情防控调研报告》正式发布

杭州市智能抗疫产品首轮测试——AI人体测温系统评估结果公布

点击“阅读原文”下载内容

识别中文_关于开展中文语音识别和语音合成基础服务可信评估的通知相关推荐

  1. python数字转中文_阿拉伯数字转换为中文数字的python实现

    #!/usr/bin/python # -*- coding: utf-8 -*- ''' 脚本功能:阿拉伯数字与中文数字转换 输入参数:阿拉伯数字,不带符号 初次编写日期:2018-07-24 说明 ...

  2. 如何使用标贝开放平台的语音识别、语音合成等服务

    为了让新用户在标贝开放平台可以更好地体验智能语音平台服务,平台推出了帮助开发者快速了解平台服务并完成测试对接的新手指引秘籍,下面就让我们一起来看看吧! 1.创建应用 进入标贝开放平台,点击创建应用,填 ...

  3. python图片显示英文字符_Python中利用Tesseract软件来识别图片中的英文与中文

    OCR与Tesseract介绍 将图片翻译成文字一般被称为光学文字识别(Optical Character Recognition,OCR).可以实现OCR 的底层库并不多,目前很多库都是使用共同的几 ...

  4. python 识别图片中的中文_Python中利用Tesseract软件来识别图片中的英文与中文

    OCR与Tesseract介绍 将图片翻译成文字一般被称为光学文字识别(Optical Character Recognition,OCR).可以实现OCR 的底层库并不多,目前很多库都是使用共同的几 ...

  5. 数据集标注工具_创新工场提出中文分词和词性标注模型,性能分别刷新五大数据集| ACL 2020...

    出品 | AI科技大本营(ID:rgznai100)中文分词和词性标注是中文自然语言处理的两个基本任务.尽管以BERT为代表的预训练模型大行其道,但事实上,中文中基于全词覆盖 (whole word ...

  6. mysql 存json中文乱码怎么设置_解决 MySQL 中文乱码

    想要解决MySQL中文乱码首先必须了解下MySQL所支持的字符集,至于中文乱码出现的原因可以总结为:向数据库中插入的数据与数据库中的表所使用的字符集编码不同 一 . MySQL 中文字符集 常见支持中 ...

  7. homepod怎么设置为中文_设置 HomePod

    设置 HomePod HomePod 和 HomePod mini 是集成了 Siri 聪明才智的智能扬声器.Siri 可让您通过自然语音交互轻松控制 HomePod,您可以播放喜爱的音乐,就日常问题 ...

  8. matplotlib 中文_详解Matplotlib中文字符显示问题

    在用matplotlib进行绘图时,如果在绘制过程中会用到中文,则默认情况下会出现字体警告,中文字符显示为方框或乱码的形式,我们这里将介绍多种解决方案. 02 目录: 1.中文字体显示问题 2.几种解 ...

  9. python常用函数中文_【python】python常用函数

    urlencode与urldecode 当url中包含中文或者参数包含中文,需要对中文或者特殊字符(/.&)做编码转换. urlencode的本质:把字符串转为gbk编码,再把\x替换成%.如 ...

  10. java解析xml中文字符乱码_各种Java中文乱码的处理方法

    对于Java,由于默认的编码方式是UNICODE,所以用中文也易出问题,常见的解决是: String s2 = new String(s1.getBytes("ISO-8859-1" ...

最新文章

  1. devexpress toolbar 填充整行宽度
  2. 科罗拉多州立大学计算机科学专业,美国科罗拉多州立大学有哪些好专业?
  3. Lambda表达式替代匿名方法
  4. CNN-1: LeNet-5 卷积神经网络模型
  5. 运维前线:一线运维专家的运维方法、技巧与实践导读
  6. 为何小程序上线了,他们的内心却留下遗憾?
  7. 攀爬者(洛谷P5143题题解,Java语言描述)
  8. 对象序列化时候无法创建类似如此(king:astar)的元素名
  9. Win7允许/禁用 PING命令
  10. linux pkill窗口,在Linux系统中pkill命令的基础,附pkill命令的使用示例
  11. 学java编程语言_对于零基础的人而言 该如何学Java编程语言
  12. 嵌入式Linux驱动学习之路(二)u-boot体验
  13. 毕设题目:Matlab图像拼接
  14. Topaz Video Enhance AI 1.9 视频增强软件
  15. CAJ格式文件怎么转换为PDF格式
  16. Linux系统中,让alias命令永久保存的方法!
  17. openssl rand
  18. 2019计算机复试平均分,2019考研平均分已经公布
  19. A. Arithmetic Array
  20. 原来ChatGPT可以充当这么多角色

热门文章

  1. python一阶差分_Python使用pandas对数据进行差分运算的方法
  2. 你弄懂了Spark的Shuffle实现方式吗?手把手带你解析Spark的Sort Shuffle和Tungsten-Sort Shuffle
  3. 利用sitemap提交漏洞劫持其它网站排名
  4. POJ 1179 Polygon
  5. 新闻抓取门道全面解析
  6. C# 死循环等待方式
  7. uniapp选择图片压缩并上传
  8. 程序员面试金典--疯狂刷
  9. 【全栈编程系列】SpringBoot整合Shiro(含KickoutSessionControlFilter并发在线人数控制以及不生效问题、配置启动异常No SecurityManager...)
  10. 用过企业微信APP 后,微信接收不到消息,解决方案