大家好我是啊忠略懂点,欢迎来到我的宝藏频道,我主要分享各种省钱避坑,跨境技术和自媒体转化工具的知识内容,如果感兴趣的欢迎订阅我的频道,看看不一样的赛道。

AI语音识别是很大的应用场景,而针对我们个人的立场出发,又有自媒体从业者, 相关论文科研报表, 电子商务语音协助, 开发翻译产品, 语音控制应用, 语音输入方向的应用衍生,如果您对这方面感兴趣或者是其中的从业者,建议看完这次的内容,可以一劳永逸的免费解决问题。

软件名称:VideoSrt语雀 0.3.3 免费语音识别+字幕制作
是一个可以识别视频语音自动生成字幕SRT文件的开源软件工具。
适用于快速、批量地为媒体(视频/音频)生成中/英文字幕、文本文件的业务场景。

打开阿里云

我们一共需要开通设置三个服务,分别是“访问控制”、“对象存储OSS”、“智能语音交互”。

请开通设置前,先自行注册阿里云账号,并完成账号的(个人/企业)实名认证。

那么首先开通并设置“访问控制”。

大体流程是“创建用户”→“设置用户权限”→记录”用户ID“+”Secret密钥“。

按照以下的辅助箭头信息的流程开通“访问控制”即可。

控制台→左上角三横图标(产品与服务)→访问控制(RAM)
→2-3次的确认立即开通→管理控制台→人员管理-用户
→创建用户(任意自定义名称)-(√)编程访问→开通

并且找到以下信息,把相匹配的信息复制粘贴替换*号并且记录下来,后续要用。

AccessKey ID :【访问控制ID】
******************

AccessKey Secret :【访问控制密码】
******************

然后回到用户界面,针对创建好的用户,最右边有“添加权限”

点击“添加权限”→增加“对象存储OSS”、“智能语音交互2.0” 这两项服务的权限,

让该服务可以在后续的使用过程中,可以管理控制这两项服务的正常工作。

对象存储OSS

该服务,个人用户每天使用2小时语音的情况下免费,超出部分存储费用-数据存储(本地冗余存储)-0.12元/GB/月。

所以软件使用的过程中,会临时的把处理的音频文件上传到这个存储空间,所以就需要看自身使用情况,在该服务的文件管理内,定期的对临时文件进行删除操作,避免出现太多的存储费用。

删除的流程是:对象存储OSS→Bucket 列表→Bucket 名称
→文件管理→(√)全选→批量操作→进行删除。

按照以下的辅助箭头信息的流程开通“对象存储”即可。

控制台→左上角三横图标(产品与服务)→对象存储OSS
→2-3次的确认立即开通→管理控制台
→创建Bucket(任意自定义名称)、
区域选择就近原则、读写权限设置为“公共读”、其他默认
→选择确定(创建)

之后找到以下信息,把相匹配的信息复制黏贴替换*号并且记录下来,后续要用。

BucketName【对象存储的名称】
******************

↓“外网访问”↓
Endpoint【对象存储的地域节点】
******************

BucketDomain【对象存储的Bucket域名】
******************

智能语音交互

按照以下的辅助箭头信息的流程开通“智能语音交互”即可。

控制台→左上角三横图标(产品与服务)→智能语音交互
→开通→录音文件识别(试用)-每天两小时免费识别时间
(√)协议→立即开通

按照以下的辅助箭头信息的流程配置“智能语音交互”即可。

管理控制台→全部项目→创建项目→语音识别+语音合成
→任意自定义名称→确定→基于场景选择模型
→非电话-[中文普通话(识音石V1-端到端模型)][识别输入项]
→确认使用→自定义选择语音合成模型[输出项]→确认使用

之后找到以下信息,把相匹配的信息复制黏贴替换*号并且记录下来,后续要用。

Appkey:【智能语音交互的Appkey】
******************

配置video语雀

打开软件界面,按照下面的流程操作,并且把相匹配的信息,复制黏贴进输入框内,并保存。

新建→语音引擎(阿里云)

名称别名:任意自定义名称【1软件显示名称,与阿里云无关】
【2 智能语音交互的Appkey】
【3 访问控制ID】
【4 访问控制Secret】

设置→OSS对象存储设置

【1 对象存储的地域节点】
【2 访问控制ID】
【3 访问控制密码】
【4 对象存储的名称】
【5 对象存储的Bucket域名】

设置→软件设置

文件输出目录:自定义设置文件夹路径

至此,后续就可以打开(拖动)媒体文件,正常自动AI识别字幕啦!

备注:

翻译功能不建议使用,因为涉及翻译过都会有后词不达意的问题,还是有必要先利用翻译系统,逐一校对中文内容的准确性,再合成内容,这样才是错误率最低的方案。毕竟对自己内容负责,是每个自媒体人的基本技能。

好了,以上就是本期的所有内容。

希望我分享的能给大家带来帮助,也别忘记点赞关注订阅分享转发,我们下次再见,啊忠感谢了。

免费自动AI语音识别制作字幕,从此解放时间自由-自媒体必备干货相关推荐

  1. 一键免费自动 AI 抠图,效果连 PS 大哥也点赞! | 程序员硬核评测

    作者 | Jane 技术支持 | 老纪.猫猫 出品 | AI科技大本营(公众号ID:rgznai100) 现在,抠图已经不再是专业设计师才会的技能,其应用的技术图像分割也不是一个新课题了,很早之前就有 ...

  2. 一键免费自动AI抠图,效果连PS大哥也点赞!

    作者 | Jane 技术支持 | 老纪.猫猫 出品 | AI科技大本营(公众号ID:rgznai100) 现在,抠图已经不再是专业设计师才会的技能,其应用的技术图像分割也不是一个新课题了,很早之前就有 ...

  3. 使用AI来制作3D字母

    使用AI来制作3D字母 写作时间:5月17日 作者:陈铭军) 这次我们来使用AI来把字母做出立体效果. 首先我们使用文字工具(T),输入一个大写的字母"M",颜色为#:000000 ...

  4. 自媒体必备工具:免费的音文对齐生成SRT字幕,快速打轴匹配声音及文字的在线工具

    对一个自媒体来说,制作字幕是一件非常令人头疼的问题.当然,网易见外工作台是一个很好的工具,可以免费进行语音识别生成字幕. 但是问题也来了,有时候由于普通话不标准,或者语速过快,导致出现很多的错别字的情 ...

  5. 耗时一个月,开发了一款基于腾讯语音自动给视频添加字幕的软件

    字幕助手是一款免费利用语音识别技术的视频字幕添加软件,这款软件主打视频字幕剪辑和添加功能,能够一键快速添加字幕,同时能够快速导出srt字幕,该软件还具有一键去水印功能,软件可以将繁琐的视频字幕翻译制作 ...

  6. 免费好用的mac字幕添加软件:ArcTime Pro中文免费版

    为大家推荐一款超好用的跨平台字幕软件,ArcTime Pro for Mac可以用来创建和编辑时间轴,字幕块绑定,进行文本编辑.翻译等,另外arttime字幕软件支持SRT.ASS等外挂字幕格式,在视 ...

  7. ai人工智能制作视频_建立一个人工智能驱动的可搜索视频档案

    ai人工智能制作视频 In this post, I'll show you how to build an AI-powered, searchable video archive using ma ...

  8. 百度免费开放长语音识别功能

    近日,百度AI开放平台向开发者免费开放长语音识别功能,通过SDK调用服务,可将长语音转换为文字.据了解,新版本SDK解除了对时间的限制,开发者无需再将长语音切割成60秒以内的分段,进行调用,提升了转写 ...

  9. 苹果4如何添加时间插件_Pr快速批量制作和添加字幕,节省时间还不用插件的做法...

    Hello,今天是兔兔发福袋的第3天,要开心哟! 本期话题:Pr快速批量制作和添加字幕,节省时间还不用插件的做法! 一说到用插件,有的人会觉得麻烦,今天给大家讲解的这个批量添加字幕的方法就不需要插件, ...

最新文章

  1. 微软:Windows 7 SP1将于本月正式发布
  2. Zabbix3.X---Zabbix _Agent主动模式的监控(Active)
  3. Algorithm:C++语言实现之链表相关算法(单链公共结点问题、一般LCA、括号匹配、最长括号匹配、逆波兰表达式Reverse Polish Notation、直方图矩形面积、收集雨水问题)
  4. C++ Primer 5th笔记(chap 13 拷贝控制) 实例2内存管理测试结果
  5. Java高并发系列 — AQS
  6. php点击按钮显示隐藏代码,jQuery中点击按钮实现显示与隐藏的方法
  7. 美的摇头风扇FW40-8A摇头拉线断了修复方案
  8. java中检测数据波动_在pyspark数据帧中检测异常值
  9. JavaScript创建与读写本地文件(IEFirefox)
  10. 怎么把GMS的软件转到HMS
  11. 7-14 与数据库相连
  12. postgresql 数据库的备份和还原
  13. 【CSDN软件工程师能力认证学习精选】Python网络编程之初识
  14. 笔记本进入pe却看不到计算机硬盘,一些笔记本进WINPE后找不到硬盘的解决办法...
  15. php 读写局域网文件,PHP访问局域网共享文件
  16. 如何删除下一页分节符_Word中批量删除分节符的方法
  17. python中缺省值处理函数DataFrame.fillna()
  18. 一段很现实的话适合发朋友圈文案
  19. JAVA导出EXCEL实现
  20. StarUML的使用

热门文章

  1. 利用RCurl实现爬虫实战
  2. Fedora 20 上安装基于dell 1420的无线网卡驱动
  3. 自动驾驶_测试场景技术发展与应用_2020
  4. 新基建背景下 数字化产业园区的机遇与挑战
  5. 用python爬取股票数据的一点小结
  6. 二手车市场回暖:忘掉颠覆创新,拥抱数据赋能
  7. Matlab符号处理工具箱简介
  8. 共享单车双寡头时代背后,ofo戴威的执念与博弈
  9. html+复选框不选中事件,html – CSS复选框事件不起作用
  10. android手机连nas,Droid NAS:让Android手机变身无线U盘