赛事简介

语音可以作为一种生物识别的形式,通过对说话人语音的采样,我们对说话的身份进行验证,在语音助手、安防等领域有着广泛的应用场景。相对于基于文本内容的说话人识别,文本无关的验证因减少了变化的约束,从而更具挑战性。语音样本可以通过不同的录音设备获取,多种设备带来的比特率不匹配、信道噪声、背景噪声等进一步增加了说话人识别的挑战。

本届大赛语音赛道我们围绕当下备受关注的智能家居、语音助手等应用场景设计赛题,开展说话人识别相关领域的比赛。区域赛中,参赛选手需要设计并训练具有鲁棒性的模型,可以胜任跨设备的文本无关的说话人识别任务。详见赛题说明。

本次大赛语音赛道数据集由希尔贝壳 AISHELL提供。


赛程安排

• 2019年03月08日 启动报名、开放初赛训练集。

• 2019年03月12日 开放训练集和开发集。

• 2019年03月18日 开放开发集提交通道供选手预演提交流程。

• 2019年03月29日 报名截止。

• 2019年04月08日 15:00 开放正式测试集及提交通道。

• 2019年04月11日 15:00 结果提交截止。

• 2019年04月15日 公布区域赛线上成绩及入选线下答辩名单。

• 2019年04月17日 至 2019年05月17日 区域赛答辩,公布总决赛入围名单。

• 2019年05月18日 发布总决赛题目。

• 2019年05月18日 至 2019年06月10日 总决赛线上赛。

• 2019年06月20日 公布总决赛线上成绩及入选线下答辩名单。

• 2019年07月01日 总决赛线下答辩。

• 2019年07月02日 公布大赛名单并颁奖。


赛题说明

决赛赛题

任务目标

为跨设备的语音识别服务设计说话人识别模块。有若干说话人共享使用语音识别服务,每个说话人均通过不同设备使用若干句语音进行注册。这些说话人使用不同的设备访问该服务,要求自动识别出每一句输入来自哪一个说话人。

规则说明

一、训练集

参赛选手可以使用大赛官方提供的训练数据集,也可自选数据集设计并训练模型,以完成说话人身份识别的任务。

训练数据不限,参赛选手可以采用任意开源数据集(须取得合法授权,并可提供给大赛主办方用于结果的复现)。

推荐训练数据:

  1. 希尔贝壳提供的 AISHELL-2 中文语音数据库。

  2. 区域赛开发集。

二、开发集与测试集

开发集与测试集结构相同,但说话人数量不同(开发集4人,测试集16人)。开发集仅供参赛选手调试和验证程序,不计入最终成绩。

每个说话人的语音来自三种录音设备:高清麦克风、Android手机和iOS手机,每种设备均有不同距离的录制。

语音包含4字以下的短句,也有4字以上的长句。

部分录音包含环境噪声。

语音数据分为注册数据和测试数据两部分。

a) 注册数据

注册数据中,每人说话人都会使用15句话注册自己的声纹,分别来自三种录音设备的进场录制。

b) 测试数据

测试数据中,包含已注册说话人的若干条语音,其中包含部分短句。

结果提交

预测结果以CSV格式提交,形如:

FileID,SpeakerID ae998e7c5e74ade76c83c884f42ca9bc,1 07767576a9e8b468d38567bf3116396d,3 ... 字段说明:

FileID 文件ID,与测试集中测试文件ID一一对应; SpeakerID 预测的说话人ID。

计分公式

S最终得分,N表示用于测试的语音数,pi表示说话人的预测是否正确,正确为1,错误为0。

结果提交

测试集会于6月7日15:00开放给选手,选手需要在72小时内提交正式数据集的验证结果、模型和代码,详见“结果提交”页面。每队选手有6次提交机会,取最好成绩作为客观成绩。

比赛要求

参赛选手需要同时提交说明文档、预测结果、训练和预测代码、模型(参数集),详见【结果提交要求】。

参赛选手所提交程序应可在Linux环境顺利运行。建议(不强制)使用Python 2.7或Python3.6作为首选编程环境。不限制第三方软件包使用,但须获得合法授权和软件拷贝,以确保主办方可以复现程序运行过程。

参赛选手提交的程序须满足输入输出的要求,参见“结果提交”页面。 参数选手的提交物需要可完整复现训练和预测过程,主办方不会做任何代码修改,如无法复现的,视作无效提交。

参赛选手可以使用公开开源的数据集和预训练模型,但需要取得合法授权并可向主办方提供作为复现参赛结果之用途。

不得将自行手工标注的结果运用于训练和测试。

决赛获奖队伍代码开源

此开源代码为2019年语音赛道决赛获奖队伍的提交代码,仅供选手交流学习。

下载地址:链接: 百度网盘 请输入提取码 提取码: 9rs7

区域赛赛题

任务目标

设计一个声纹锁,家庭成员可以在特定设备上通过任意3句短句注册身份,仅家庭成员通过说任意短句可以开锁,未注册人员(攻击者)无法通过语音开锁。

规则说明

参赛选手需要基于给定的训练数据集或自选数据集,设计并训练模型,以完成说话人身份识别的任务。

训练数据不限,参赛选手可以采用任意开源数据集(须取得合法授权,并可提供给大赛主办方用于结果的复现)。

推荐训练数据:希尔贝壳提供的 AISHELL-2 中文语音数据库。

测试集中包含若干组说话人,每组说话人中有5位家庭成员,5位攻击者。其中,每个家庭成员都会用3句话注册自己的声纹,每个家庭成员可能来自不同的设备注册(远场麦克风或近场Android手机设备),但每个人只使用一种设备注册。每个组提供5个家庭成员与5个攻击者用于验证的语音,每句话有可能来自任意一种设备。声纹锁需要区分每句话是否来自家庭成员。

数据集详细信息见“数据集”页面。

预测结果以CSV格式提交,形如:

FileID,IsMember
ae998e7c5e74ade76c83c884f42ca9bc,Y
07767576a9e8b468d38567bf3116396d,N
...

字段说明:

• FileID 文件ID,与测试集中测试文件ID一一对应;

• IsMember 是否家庭成员,Y为是,N为否。

S最终得分,N表示用于测试的语音数,pi表示家庭成员的预测是否正确,正确为1,错误为0。

数据集发放与结果提交

开发集会先行开放,提供给参赛选手调试程序和验证模型。开发集结果可提交至竞赛平台,获取跑分,但不计入比赛成绩。

测试集会于约定时间开放给选手,选手需要在72小时内提交正式数据集的验证结果、模型和代码,详见“结果提交”页面。每队选手有3次提交机会,取最好成绩作为客观成绩。

比赛要求

• 参赛选手需要同时提交说明文档、预测结果、训练和预测代码、模型(参数集),详见【结果提交要求】。

• 参赛选手所提交程序应可在Linux环境顺利运行。建议(不强制)使用Python 2.7或Python3.6作为首选编程环境。不限制第三方软件包使

用,但须获得合法授权和软件拷贝,以确保主办方可以复现程序运行过程。

• 参赛选手提交的程序须满足输入输出的要求,参见“结果提交”页面。

• 参数选手的提交物需要可完整复现训练和预测过程,主办方不会做任何代码修改,如无法复现的,视作无效提交。

• 参赛选手可以使用公开开源的数据集和预训练模型,但需要取得合法授权并可向主办方提供作为复现参赛结果之用途。

• 不得将自行手工标注的结果运用于训练和测试。


奖项设置

总奖金额 100,000元。

区域赛

获奖说明:各分赛道区域赛阶段,各区域中系统评定分数前五名的队伍进入现场答辩环节,最终在区域赛现场答辩环节中获得各区域内前三名及优秀奖的队伍可获得以下奖励权益:

奖学金及奖品

• 第一名队伍:5000 元 /队;机械键盘1个/队;七月在线3299元VIP会员1个/队;人工智能图书1本/队;贪心学院价值3100元学习礼包;

• 第二名队伍:2000 元 /队;机械键盘1个/队;七月在线1000元课程代金券一张/队;人工智能图书1本/队;贪心学院价值3100元学习礼包;

• 第三名队伍:1000 元 /队;机械键盘1个/队;七月在线1000元课程代金券一张/队;人工智能图书1本/队;贪心学院价值3100元学习礼包;

• 优秀奖队伍:七月在线100元课程代金券一张/队;人工智能图书1本/队;贪心学院价值3100元学习礼包。

奖励/荣誉

• 可参加知名企业大数据及AI专项培训、现场授课、在线直播;

• 免费成为中国计算机学会CCF会员;

• 获得知名企业的就业、实习机会;

• 业内专家、大咖指导和交流;

• 中国青少年发展基金会奖学金荣誉证书。

决赛

获奖说明:决赛阶段,各区域中系统评定分数前三名的队伍晋级决赛,决赛系统评定分数前五名的队伍进入决赛现场答辩环节,最终在决赛现场答辩环节中获得各项目内前三名及优秀奖的队伍可获得以下奖励权益:

奖学金及奖品

• 第一名队伍:50000 元 /队;iPad2018新款1部/队;七月在线3299元VIP会员1个/队;人工智能图书1本/队;贪心学院训练营礼包并直接入选论文社;

• 第二名队伍:20000 元 /队;七月在线1000元课程代金券一张/队;机械键盘1个/队;人工智能图书1本/队;贪心学院训练营礼包并直接入选论文社;

• 第三名队伍:10000元 /队;七月在线1000元课程代金券一张/队;机械键盘1个/队;人工智能图书1本/队;贪心学院训练营礼包并直接入选论文社;

• 优秀奖:七月在线1000元课程代金券一张/队;人工智能图书1本/队;贪心学院训练营礼包并直接入选论文社;

• 此外所有参赛队伍均可获得由贪心学院提供的1550元课程优惠礼包。

奖励/荣誉

• 可参加知名企业大数据及AI专项培训、现场授课、在线直播;

• 免费成为中国计算机学会CCF会员;

• 获得知名企业就业、实习机会;

• 业内专家、大咖指导和交流;

• 中国青少年发展基金会奖学金荣誉证书。


语音决赛测试集结果提交排行榜

名次 战队名称 得分 提交时间
1 代码是不会骗人的 0.992738 2019-06-12
2 张良请战暗影主宰 0.976239 2019-06-12
3 橙色葫芦娃 0.970320 2019-06-12

区域赛测试集结果提交排行榜

名次 战队名称 得分 提交时间
1 IIPL 0.984444 2019-04-11
2 niceLi 0.975556 2019-04-11 
3 代码是不会骗人的 0.948889 2019-04-11

联系我们

微信添加:futurelab001

赛事官网

2019未来杯高校AI挑战赛-AI FUTURELAB-竞赛 数据 课程

2019未来杯高校AI挑战赛-跨设备说话人识别相关推荐

  1. 2019 未来杯高校AI挑战赛 区域赛作品

    2019 未来杯高校AI挑战赛 区域赛作品 根据组委会提供的图像,将3张图像合成一张伪彩色图像,构造数据集.从超新星搜寻与比赛计分方式来看,应该多关注havestar部分的数据,少关注nostar部分 ...

  2. 2019 未来杯高校 AI 挑战赛 图像-发现超新星

    2019 未来杯高校 AI 挑战赛 > 图像-发现超新星 1. 任务目标 设计一个目标检测模型,从天文望远镜拍摄到的影像中发现疑似新星.超新星. 2. 规则说明 参赛选手需要基于给定的数据集,设 ...

  3. 着眼未来!2019未来杯高校AI挑战赛圆满落幕

    在目前地产行业不断向大数据智能化转型的背景下,作为行业领先的房地产大数据应用服务商,2019克而瑞再度延伸,参与了第二届"未来杯高校AI挑战赛".在此次的大赛中,克而瑞一览当代高校 ...

  4. 2019未来杯高校AI挑战赛之图像-发现超新星

    1. 参赛网址 https://ai.futurelab.tv/contest_detail/1 2. 背景知识介绍 http://psp.china-vo.org/article/sysaquiz1 ...

  5. 未来杯区域赛临近收官,多家高校队伍共同挑战人工智能领域的难题

    由中软国际教育科技集团旗下睡前Futurelab携手中国青少年发展基金会.DeepTech和华为手机共同主办,清华语音和语言技术中心.北京希尔贝壳科技有限公司和厦门大学海洋与地球学院共同协办的&quo ...

  6. 学术联赛 | 运用知识图谱技术,赋能多领域应用 ——“未来杯”AI学术联赛总决赛暨颁奖典礼圆满落幕...

    本文转载自公众号:AI学习社. 由北京大学软件工程国家工程研究中心主办,华为终端有限公司及中软国际教育科技集团全程战略支持,STEER TECH科技平台.北京乐智元素科技有限公司.艾肯文化传媒(北京) ...

  7. 运用知识图谱技术,赋能多领域应用 ——“未来杯”AI学术联赛总决赛暨颁奖典礼圆满落幕...

    点击蓝字 关注我们 AI TIME欢迎每一位AI爱好者的加入! 由北京大学软件工程国家工程研究中心主办,华为终端有限公司及中软国际教育科技集团全程战略支持,STEER TECH科技平台.北京乐智元素科 ...

  8. 倒计时2天 校园行|AI TIME “未来杯” 走进浙江大学

     点击蓝字 关注我们 AI TIME欢迎每一位AI爱好者的加入! 2021年7月13日,AI TIME 联合 未来杯,共同邀请到了来自浙江大学人工智能系系主任杨洋副教授.阿里巴巴资深算法专家杨红霞老师 ...

  9. 今天下午2点|AI TIME “未来杯” 走进浙江大学

     点击蓝字 关注我们 AI TIME欢迎每一位AI爱好者的加入! 2021年7月13日,AI TIME 联合 未来杯,共同邀请到了来自浙江大学人工智能系系主任杨洋副教授.阿里巴巴资深算法专家杨红霞老师 ...

最新文章

  1. 转 微博 linux中ctime,mtime,atime的区别
  2. String 中的hashCode方法
  3. python考证书-计算机二级 Python 怎么考?考什么?
  4. xay loves count 枚举-复杂度-顺序无关-选择
  5. rsa.FromXmlString 系统找不到指定的文件
  6. Android7.0 Doze模式分析(一)Doze介绍 amp; DeviceIdleController
  7. postgres的数据库备份和恢复
  8. 【活动】侬好上海,Microsoft Reactor来啦
  9. 【ArcGIS Pro微课1000例】0013:NOAA全球1km分辨率DEM下载及拼接教程(附已拼接成果下载地址)
  10. java集合概念_JAVA集合概念
  11. Python 数据科学手册 5.7 支持向量机
  12. 背景图怎么置于底层_Ps素材教程含有刻度的背景图
  13. LeetCode 77. Combinations
  14. JavaScript学习指南 (来自转载)
  15. MATLAB逆谐波均值滤波
  16. HealthKit框架简介
  17. 解决微信网页授权多个域名(大于两个)
  18. 前端三件套之css笔记
  19. SLAM本质剖析-Boost
  20. 行存储和列存储小介绍

热门文章

  1. 中国电子学会2022年06月份青少年软件编程Scratch图形化等级考试试卷二级真题(含答案)
  2. 《数学之美》第十四章——余弦定理和新闻的分类
  3. 通过cmd设置path环境变量
  4. 海潮改正matlab,OSU提供的读取tpxo7.2海潮模型的matlab使用软件
  5. 计算机wps文字基础知识,2018年9月计算机一级WPS基础知识教程:wps新功能
  6. 局域网中有源以太网POE(Power Over Ethernet)的意思
  7. 【分布式】CAP原则和BASE理论
  8. 污水流量计的四种连接方式及仪表检测的方法
  9. 软件架构师的角色定位和培养
  10. mysql derived2_MySQL · 新特性分析 · 5.7中Derived table变形记-阿里云开发者社区