1. 数据采集自有声书网站,首先对每个句子做一遍语音识别,识别模型使用WSJ示例中的声学模型,语言模型使用二元文法,语言模型数据为语音数据对应的电子书文本。根据识别结果,统计每个说话人的WER,从低到高排序,前一半标记为clean,表示这些说话人语音比较清晰,其余标记为other。

    1. WSJ:是一个朗读数据。内容是朗读华尔街日报,共80小时。是kaldi中的一个示例
    2. 二元文法:
      1. 语言模型:计算句子出现的概率的模型,统计的对象就是人工标注成的语料库
      2. 随着句子长度增大,语言模型会遇到的问题:
        1. 数据稀疏:长度越长的句子越难出现,可能统计不到频次。
        2. 计算代价越大,需要的存储越多。即使用字典树索引,代价还是很高。
      3. 使用马尔可夫假设来简化语言模型:
        1. 马尔可夫链 :给定时间线上有一串事件顺序发生,假设每个事件的发生概率只取决于前一个事件,那么这串事件构成的因果链被称作马尔可夫链。
        2. 在语言模型中,每个单词出现的概率只取决于前一个单词,则该语言模型称为二元语法模型
        3. 由于语料库中二元连续的重复程度要高于整个句子的重要程度,缓解了数据稀疏的问题,另外二元连续的总数量远远小于句子的数量,存储和查询也得到了解决。
    3. WER:词错率,一项用于评价ASR性能的重要指标,用来评价预测文本与标准文本之间错误率,因此词错率最大的特点是越小越好。像英语、阿拉伯语语音转文本或语音识别任务中研究者常用WER衡量ASR效果好坏。
  2. 该数据集是包含大约1000小时的英语语音的大型语料库。这些数据来自LibriVox项目的有声读物。它已被分割并正确对齐,如果你正在寻找一个起点,请查看已准备好的声学模型,这些模型在kaldi-asr.org和语言模型上进行了训练,适合评估。

LibriSpeech数据集--学习笔记相关推荐

  1. KITTI数据集学习笔记

    Kitti数据集 本文为笔者自我学习的笔记,本人刚入门3D视觉,若有错误的地方恳请各位指正.另外参考了一篇热门博客:https://blog.csdn.net/Solomon1558/article/ ...

  2. S3DIS数据集学习笔记

    1.整体介绍 S3DIS是一个大型的3d室内数据集.S3DIS数据集共五个区域 共271个房间 每个区域有多个物体,每个物体的类别有一个对应的txt文件,txt文件中存储的都是点的坐标和颜色信息,其类 ...

  3. 数据集学习笔记(一):常用检测、行为检测数据集

    文章目录 常用检测数据集 一 CIFAR系列 二 COCO 三 VOC系列 四 CIFAR10 五.TT100K 六 将图像数据集划分为训练集,验证集,测试集 常用行为检测数据集 UCF101 常用检 ...

  4. 显著性检测数据集—学习笔记

    文章目录 DUT-OMRON DUTS HKU-IS ECSSD/CSSD SOD PASCAL-S 参考资料 DUT-OMRON 数据集包含5168张图像,最大边长为400像素,数据集中具有一个或多 ...

  5. 数据集学习笔记(四):VOC转COCO数据集并据txt中图片的名字批量提取对应的图片并保存到另一个文件夹

    文章目录 转换代码 根据名字将图片保存在另一个文件夹 转换代码 import os import random import shutil import sys import json import ...

  6. 显著性检测—学习笔记

    视觉显著性旨在模仿人类视觉系统选择视觉场景的某个子集的能力.而显著性物体检测(SOD)则侧重于检测场景中吸引最多注意力的物体,然后逐像素的提取物体的轮廓.SOD的优点在于它在许多计算机视觉任务中均有广 ...

  7. Caffe学习笔记3——制作并训练自己的数据集

    Caffe学习笔记3 本文为原创作品,未经本人同意,禁止转载,禁止用于商业用途!本人对博客使用拥有最终解释权 欢迎关注我的博客:http://blog.csdn.net/hit2015spring和h ...

  8. python数据挖掘学习笔记】十九.鸢尾花数据集可视化、线性回归、决策树花样分析

    #2018-04-05 16:57:26 April Thursday the 14 week, the 095 day SZ SSMR python数据挖掘学习笔记]十九.鸢尾花数据集可视化.线性回 ...

  9. 《南溪的目标检测学习笔记》——COCO数据集的学习笔记

    1 COCO数据集 COCO数据集下载链接:COCO_download 1.1 数据概览 数据集大小 train: 118287张 train+val: 123287张 val: 5000张 目标数量 ...

最新文章

  1. 如何建立JSP操作用以提高数据库访问效率
  2. 设置 docker容器 禁用网络
  3. web-5. 超链接的使用
  4. SQL Case When Then 条件判断
  5. gps导航原理与应用_一文读懂角速度传感器(陀螺仪)的应用场景
  6. 正确地启动hadoop
  7. P4338-[ZJOI2018]历史【LCT】
  8. 数据库只有mdf文件而没有ldf文件,如何恢复数据库
  9. php怎么将网页另存为mht代码,mht转html代码(php)
  10. V-Play入门手册3-如何编写高效的代码?
  11. iOS 关于布局问题的一些认识
  12. java1.8 64_jdk 1.8 64位 官方版
  13. Eclipse+Wildfly10 创建第一个EJB项目
  14. UTM投影坐标计算距离
  15. RTL8762DW手环烧录方法
  16. 软件测试类型-文档测试
  17. 硬件之家 | 智能手环、手表是如何监测睡眠的
  18. 域外计算机无法连接远程桌面,如何开启域内计算机的远程桌面连接?
  19. 关于DSP28335CCS6编译时出现error #10099-D: program will not fit into available memory.
  20. Centos7安装加速下载工具aria2

热门文章

  1. 转载:第2章 Nginx的配置 概述《深入理解Nginx》(陶辉)
  2. 2021-2027年全球与中国顶面基层行业市场前瞻与投资战略规划分析报告
  3. Perfdump 工具
  4. traefik使用 -- consul catalog动态配置
  5. 安装易语言后需要做的事情
  6. 雷神/雷电模拟器 之已开启,但不显示指针位置与显示点按操作反馈处理方案
  7. 用友t 的服务器找不到系统管理,用友U8.51A服务器登录软件提示找不到服务器
  8. 适合女生从事的IT职业,前途美美光明
  9. 理科女生最吃香的十大职业(这十大职业就业率高)
  10. 2017-09-23-ArchData