免费AI数据标注工具-音频标注软件
最近疫情比较严重,大家有没有发现有一个AI应用有点起死回生的感觉了,当然不是图片识别的应用场景了,例如口罩识别、无接触体温检测等等已经火爆的一塌糊涂了,如果有对口罩遮挡识别的小伙伴可以看我的另一篇文章【AI实战】口罩佩戴检查。而是电话机器人,由于19年出国家出台了比较严的整治电话骚扰的政策,导致外呼、回访、电话销售等等行业的需求意愿急剧下降,由于疫情反而让这种可以解决劳动密集型的电话客服的电话机器人悄然有回暖了。
所以今天就跟大家语音标注的内容,目前阶段的语音识别在通用场景上的准确率已经很高了,有些特殊场景因为传统头部公司的实际需求也在不断的落地,所以好多场景的语音相关需求已经从仅仅的识别需求提升到角色识别、情感识别等了。这篇文章介绍一款非常好用的线下语音处理分析软件--Praat。
Praat语音学软件,原名Praat:doing phonetics by computer,通常简称Praat,是一款跨平台的多功能语音学专业软件,主要用于对数字化的语音信号进行分析、标注、处理及合成等实验,同时生成各种语图和报表。
首先介绍一下Praat都可以做哪些事情,然后再结合数据标注本身来介绍一下其功能特点。不管是做语音识别的小伙伴还是做标注的小伙伴都可以学习一下,非常好用。
一.Praat可以做哪些事情?
1.频谱分析
2.基频分析
3.强度分析
4.共振峰分析
5.语音标注
6.语音参数调整和合成
7.提前语音数据
8.语音数据的统计分析
是不是非常牛?这篇文章主要是要介绍标注语音时的工具使用,所以呢这里只介绍第五部分语音标注。然后其他的部分后面再单独写文章和大家交流。
二.利用Praat做语音标注和切音
1.利用Praat做语音标注工作
为了方便大家使用,本文中使用的软件是Praat的汉化版,如果有小伙伴需要的话可以在公众号留言分享给大家。
注:这里提示一下,软件会有很多快捷键,可以在使用的时候方便大家进行标注。
2.利用Praat工具进行切音工作
因为Praat工具非常友好,可以进行编写脚本程序,在很大程度上扩展其功能,在这里给大家讲解一下利用Praat做切音的工作。
切音脚本:
form dialogue
comment 请输入源声音文件和标注文件所在目录:
text openpath /Users/wangzhenzhen/Desktop/test/todo
comment 请输入切分后声音保存目录:
text savepath /Users/wangzhenzhen/Desktop/test/over
comment 请输入标记所在层级及标记内容:
positive tier_number 1
sentence mark_string
comment 请输入数字位数:
positive limit 4
comment 生成一个文件名列表
text saveTXTpath /Users/wangzhenzhen/Desktop/test/out.txt
endform
if right$(openpath$,1) <> "/"
openpath$ = openpath$ + "/"
endif
if right$(savepath$,1) <> "/"
savepath$ = savepath$ + "/"
endif
deleteFile: saveTXTpath$
Create Strings as file list: "fileList", openpath$ + "*.wav"
numofFiles = Get number of strings
for i from 1 to numofFiles
selectObject: "Strings fileList"
fileName$ = Get string: i
order = 1
Read from file: openpath$ + fileName$
nameOfFile$ = selected$("Sound")
textgridNameOfFile$ = nameOfFile$ + ".TextGrid"
Read from file: openpath$ + textgridNameOfFile$
numOfIntervals = Get number of intervals: tier_number
for j from 1 to numOfIntervals
selectObject: "TextGrid " + nameOfFile$
startTime = Get start point: tier_number, j
endTime = Get end point: tier_number, j
labelOfInterval$ = Get label of interval: tier_number, j
if (labelOfInterval$ = mark_string$ and mark_string$ <> "") or (labelOfInterval$ <> "" and mark_string$ = "")
#####将范围根据标的情况前后分别扩大0.3秒
startTime1 = startTime - 0.3
endTime1 = endTime + 0.3
Extract part: startTime1, endTime1, "no"
selectObject: "Sound " + nameOfFile$
Extract part: startTime1, endTime1, "rectangular", 1, "no"
## 这一段得到一个序号的前面填充0的N位整齐数字
temp = order
ii = 0
repeat
temp = temp div 10
ii = ii + 1
until temp = 0
sumtemp = limit - ii
mark$ = ""
for jjj from 1 to sumtemp
mark$ = mark$ + "0"
endfor
mark$ = mark$ + string$(order)
##
selectObject: "Sound " + nameOfFile$ + "_part"
Save as WAV file: savepath$ + nameOfFile$ + "_" + mark$ + ".wav"
selectObject: "Sound " + nameOfFile$ + "_part"
Remove
selectObject: "TextGrid " + nameOfFile$ + "_part"
Remove
order = order + 1
endif
endfor
selectObject: "TextGrid " + nameOfFile$
Remove
selectObject: "Sound " + nameOfFile$
Remove
endfor
select Strings fileList
Remove
以上就是Praat在数据标注过程中比较重要的两个应用,后面如果大家感兴趣的话,会对Praat的其他功能进行介绍,当然如果有小伙伴需要软件或者脚本也欢迎大家留言获取。
免费AI数据标注工具-音频标注软件相关推荐
- 11个免费的数据可视化工具推荐
数据可视化之所以流行,不仅是因为它简化了我们查看复杂数据的方式,更是因为数据可视化可以加快我们获取数据信息的速度. 本文专门为您列出了11个免费的数据可视化工具,帮助您快速掌握数据可视化技能. 1.即 ...
- 免费AI标注工具-音频查重工具
好久没有分享好用的标注工具了,今年针对公众号也想主要想从4个方面和小伙伴进行分享,主要是行业信息.相关工具.行业知识和其他,其他的话就是我个人的一些经历和学习感悟,如果有好的想法也可以留言和我交流. ...
- 好用的标注工具和标注数据处理代码
一. 标注工具 1.Labelme(官网链接) windows环境: 首先安装Anaconda,Python3+版本. 安装成功后,打开Anaconda Prompt,然后依次输入以下命令. # py ...
- 免费的数据准备工具:talend
我喜欢寻找可以帮助我创建见解的新数据产品.为了方便使用和提高速度,我混合使用了代码和无代码工具.当我从事个人项目或自由合同时,我专注于低成本的工具.过去一周,我正在审查"数据质量解决方案&q ...
- AI 工具分享第 4 期:13 款国外免费AI视频生成工具
0. 未来百科 未来百科,是一个知名的AI产品导航网站 -- 为发现全球优质AI工具而生 .目前已 聚集全球3000+优质AI工具产品 ,旨在帮助用户发现全球最好的AI工具,同时为研发AI垂直应用的创 ...
- 99.99%准确率!AI数据训练工具No.1来自中国
萧箫 发自 凹非寺 量子位 报道 | 公众号 QbitAI 这年头,真是什么样的数据集都有了. IBM的5亿行代码(bug)数据集.清华&阿里的460万少样本NER数据集.还有假货数据集.&q ...
- 换脸视频怎么做出来的?AI视频换脸教程【完整版手把手】免费AI换脸视频工具制作过程详解
上期分享了wav2lip-GFPGan图片说话转视频的文章: 超写实虚拟数字人再升级:Wav2Lip-GFPGAN完整版教程及效果视频评测[手把手]_baoxueyuan的博客-CSDN博客 部分饱子 ...
- mt4交易系统源码_mt4周边:一款免费的数据下载工具
我们在使用ea 回测的时候,如果使用自带的数据回测,因为数据质量问题,无法回测出ea的实际盈亏能力.这时就需要一个高质量的数据来回测,而自带的数据往往不能满足这一点 我今天要介绍的是一款ticksto ...
- 深度学习数据标注工具
2020.12.7 更新 免费AI数据标注工具合集-图片标注 免费AI数据标注工具-音频标注软件 免费AI标注工具-人体关键点工具 免费AI标注工具-医疗影像标注工具 常用的目标检测工具有很多,但是图 ...
最新文章
- pyqt5获取屏幕大小并将窗口大小设置为屏幕的百分之六十
- 阿里云华北3超大规模数据中心开服 ECS全系列降价20%
- 【Spring学习】Spring JdbcTemplate之五类方法总结
- 《剑指offer》旋转数组的最小数字
- javascript提取标签之间的信息
- Azure Application Insights REST API使用教程
- vscode设置中文,设置中文不成功问题
- IntelliJ IDEA竟然出了可以在云端编码的功能?
- 【Kafka】Could not find or load main class kafka.tools.ConsumerOffsetChecker
- 未来几十年替代手机的是什么产品?
- 2019春运大幕即将开启 西安动车列车员整装迎春运
- Windows7磁盘检查与整理的使用
- VS 2003/VS 2005 迅雷资源下载网址
- 服务器是怎样进行中断的,企业如何减少服务器中断风险
- Android本地视频压缩方案
- 计算机教室如何防火,校园防火及火灾逃生自救安全常识
- java客服管理系统计算机毕业设计MyBatis+系统+LW文档+源码+调试部署
- 前苏联切尔诺贝利辐射禁区拍摄到野生水獭吞食鱼
- 一个曾经失眠九年的工程师告诉你怎样拥有更好的睡眠
- js通过开始时间和结束时间计算出中间的所有日期,并且转换为层级结构数组对象,用于甘特图头部日期数据
热门文章
- 微信小程序关于页面不跳转的问题
- KB奇遇记(3):信息化沙漠
- python聊天室设计_如何使用 Python 开发一个聊天室?
- Hangfire Pro 2022-08-31 update
- MySQL插入数据库乱码问题Incorrect string value: ‘\xE8\xB5\xB5‘ for column ‘name‘ at row 1
- 小写金额转为中文大写
- 硬盘安装ovf镜像版Linux,linux-OVF模板部署问题
- 摄影师用AI预测MJ、李小龙活到现在长什么样,网友看后泪目
- 程序哨兵----誓把流氓软件赶出我们的电脑!
- 台式计算机如何连接手机热点上网,台式机如何使用手机热点上网