目录

    • 引言
      • 问题提出
    • 工具介绍
      • 数据说明
      • 工具下载
      • 工具使用
        • 标注
        • 查找
  • 关注
  • 版权说明

引言

无论是学术课题的研究或者是公司项目的进行,数据处理是必然的,对语音数据来说,通过Praat标注仍然是很多学术团体或者公司使用较多的手段,包括语音识别和语音合成等。这些标注数据不仅是十几句的问题,以现在大数据的标准,你所面临的数据可能是上千,上万级别的。

问题提出

通过Praat进行标注是很方便的,问题在于,Praat不象是办公软件会有自动保存功能,如果你进行大量的数据标注,需要首先打开这个音频和标注文件:

其次,选择音频和标注文件,点击View&Edit进行标注。

最后,还要记得把你的标注文件,进行保存

每标一句,即使不算你进行标注的时间,恐怕打开,保存,也要消耗2-3秒吧。如果以这种方式进行上千,上万句的标注,这过程能让人崩溃。新版的Praat支持一次性打开多个文件,这也是一种手段,就是你可以同时打开大概100句吧,这样每标完一句,保存,关掉。再进行窗口的下一句。
​​​​
这里为大家提供一个辅助Praat进行标注的工具,是用C#写的。使用这个工具,设置好你的数据的目录之后,点击开始,可以自动读取文件使用Praat标注,并且自动保存,不需要通过频繁打开,保存,进行操作。这将会大大节省标注时间。

小提示:如果你有条件使用两个笔记本+显示器两个屏幕,一个窗口放这个工具,另外一个窗口是打开的Praat进行标注,你的效率将会达到极致。

工具介绍


Praat.exe 这个是通用的标注工具,你可以任意换成现在的最新版Praat(建议官网下载)。
sendpraat.exe 这个程序调用的一个接口程序,这也是Praat官方网站提供的。
Praat标注辅助工具.exe 本程序。

数据说明

所有数据来自http://ocw.mit.edu/index.htm

工具下载

http://download.csdn.net/detail/shaopengfei/8386563 如果需要积分,下载完成之后,评论一下,积分就会被返还。

工具同步上传github,不过需要自己下载一个Praat到这个目录里。
https://github.com/feelins/Praat_Scripts/tree/master/Praat_Tools

工具使用

标注

  1. 选择TextGrid目录以及Wav目录:默认是和工具同在一个目录下的TextGrid以及wav目录两类文件可以放在同一目录下;目录中不能有中文和空格。

  2. 点击“开始标注”,文件的列表会显示在左下角的框内,同时显示TextGridWav的文件数量;

  3. 双击文件列表框内的文件名,就可以开始标注了;

  4. 在标注的过程中,使用上一个下一个在列表中自动跳转,跳转的同时会自动保存上一个打开标注的文件,同时这个文件以及其标注时间会保存在工具所在的目录下的modify.log里;

  5. modify.log里保存了所有的文件列表,并且修改过的文件会产生一个时间标志。

  6. 再次打开这个软件,点击开始标注时,即会首先读取modify.log,定位到第一个没有标的文件上。

  7. 关闭这个软件,也会对刚刚打开的TextGrid进行保存。

查找

该工具也可以查找第一层的相关信息,具体使用如下:

1.在下面的框内输入需要搜索的文本,可以是一个,也可以是多个,多个之间需要用空格或者逗号隔开;

比如输入SIL,会在你的数据目录里搜索出SIL的所有位置,双击这些选项,将会根据显示的时间标记,直接定位到你标注的SIL的位置。

2.可以选择精确查找,这样只搜索相等的内容,默认是搜索相似的内容。
比如上例,如果精确查找SIL是搜索不出来的,你需要输入<SIL>,即要和标注文件里的内容完全相同。
3.结果显示在列表中,并且保存在findResult.log里。

4.双击这些结果也可以定位到这个内容所在的位置。

关注

关于对本站脚本的使用咨询,以及功能修改,增加等,都可以扫QQ咨询群,私信群主。

版权说明

1、版权归本公众号“极地语音工作室”,原名“语音处理小站”所有;

2、未经本站或者作者允许, 不得任意转载本文内容,否则将视为侵权;

3、转载或者引用本文内容请注明来源及原作者;

4、对于不遵守此声明或者其他违法使用本站内容者,本人依法保留追究权等。

Praat使用 | 辅助Praat进行标注的工具相关推荐

  1. Praat脚本-037 | 批量把标注TextGrid生成韵律文本

    目录 引题 方案一 方案二 方案三 获取脚本 关注 版权说明 引题 Praat是一种非常出色.轻便.开源免费的标注工具,它的最主要用途是标注,即对语音信号中的一些特征.信息进行标注,保存为TextGr ...

  2. Praat脚本-017 |拆分已经标注好的音素为两个音素

    目录 引题 获取脚本 关注 版权说明 引题 在标注过程中,一批任务标完之后,可能对一些音素重新进行了定义,这时候可能会需要批量将一个音素拆分成两个音素,比如对于双元音,au,拆分成a和u,当然扩展开来 ...

  3. praat对音频文件进行标注

    使用praat对音频文件进行标注 写在前面 现在的主要任务是,分析人声和背景噪声,这当然需要人工标注,以此记录 打开软件 点击右侧Annotate生成textgrid文件 然后选中音频文件和textg ...

  4. Praat脚本-026 | 谈谈自动标注这点儿事(2)

    第一篇为大家推荐了第一种级别的"自动标注",其实相当于协助大家把一些需要的信息增加进去. Praat脚本-023 | 谈谈自动标注这点儿事(1) 第一,傻乎乎的自动标注, 第二,使 ...

  5. Praat脚本-019 | Praat批量修改音频通道数

    目录 引题 运行脚本 获取脚本 关注 版权说明 引题 今天为大家推荐一个脚本,是批量修改音频的通道数量的,有时候由于一些专业录音设备在录音的时候,可能是用的双通道录音的,也称为stereo,当用Pra ...

  6. OpenCV探索之路(二十五):制作简易的图像标注小工具

    搞图像深度学习的童鞋一定碰过图像数据标注的东西,当我们训练网络时需要训练集数据,但在网上又没有找到自己想要的数据集,这时候就考虑自己制作自己的数据集了,这时就需要对图像进行标注.图像标注是件很枯燥又很 ...

  7. OpenCV精进之路(二十):工具——图像标注小工具

    搞图像深度学习的童鞋一定碰过图像数据标注的东西,当我们训练网络时需要训练集数据,但在网上又没有找到自己想要的数据集,这时候就考虑自己制作自己的数据集了,这时就需要对图像进行标注.图像标注是件很枯燥又很 ...

  8. Praat脚本-018 | Praat批量调整音量

    目录 引题 操作介绍 运行脚本 获取脚本 关注 版权说明 引题 要进行语音实验,录音的环节其实是成功的第一步,录音质量.发音人表现.录音内容的设计都是必须要认真对待的,否则最后花了很多精力和财力,最后 ...

  9. Snipaste专业截屏贴图 标注取色工具 一个比QQ截图好用一万倍的截图神器!

    粗暴提示:前方动图较多,请在网络良好的情况下观看! 嗨,各位木友们晚上好,我是小木. 今天这篇文章的投稿来自木友雷晓柒,小木也是看完他这篇文章才知道有这么一款神器的! 接下来就把舞台交给雷晓柒,灯光师 ...

最新文章

  1. Docker学习(一)Ubuntu版本的Docker安装和使用
  2. 病理分析常见数据集及常用模型方法总结
  3. WAIC开发者日倒计时两天,收藏好这份完整日程
  4. nova虚拟机打不开console
  5. [练习] 用PYTHON来优化网站中的图片
  6. Laravel中一些要记住 的写法
  7. Linux运维常用命令总结
  8. 你真的清楚DateTime in C#吗?
  9. react取消捕获_React学习笔记(三)
  10. spring整合hibernate的applicationContext.xml文件配置以及web.xml
  11. apm飞控制作_传统直接转矩控制
  12. 基于JAVA+SpringMVC+Mybatis+MYSQL的电费用电管理系统
  13. 使用CompletableFuture实现业务服务的异步调用实战代码
  14. 分布式相关面试题总结
  15. 零件测绘与计算机作图理论试题,浅谈《零部件测绘与cad成图技术》技能竞赛对中职机械制图和cad制图课程整合的影响...
  16. c语言定时器中断实验报告,单片机实验报告-定时器中断实验.doc
  17. 算法训练 - 黑色星期五 有些西方人比较迷信,如果某个月的13号正好是星期五,他们就会觉得不太吉利,用古人的说法,就是“诸事不宜”。请你编写一个程序,统计出在某个特定的年份中,出现了多少次既是13号又
  18. win7修改驱动inf,驱动非官方美加狮XBOX360手柄
  19. hiveserver2连接报错:“User: xxx is not allowed to impersonate yyy (state=08S01,code=0)”
  20. ad中电容用什么封装_何为无极性电容?是干什么用的?

热门文章

  1. EtherCAT主站掉线后,如何保证目标系统免受故障影响?
  2. 计算机科学前沿期刊,FCS|期刊动态:《计算机科学前沿》2021年第一期精彩文章...
  3. 2021地理设计组一等奖:融合短视频和深度学习的城市空间意象解构与分析
  4. [大数据技术与应用省赛学习记录一]——软件准备
  5. HDU 3698-Let the light guide us(线段树+DP)愿圣光忽悠你
  6. QGIS基本功| 图查属性、属性查图
  7. Vue 批量导入 excel 表格数据
  8. 书——《你的生命有什么可能》
  9. [野狐行][辅助开发系列课程][2016/4/7][门外系列更新完毕]
  10. vue利用CodeMirrorr+json-lint实现可编辑可自动格式化的Json-Editor组件