绵阳创客开发长语音识别平台 1小时语音10分钟转化为文字
四川在线消息(鲁文林 四川日报记者 祖明远)整理录音是很多文字工作者的噩梦:将录音整理为文字,往往需要1-2倍录音时长的时间。近日,国内首款PC端长语音识别平台在绵阳问世——1小时的语音,只用10分钟就能转化为文字,而且识别率达到97%以上。而开发者的初衷居然是:为了方便整理领导讲话录音!
转换速度快 1小时录音只用10分钟
1月25日,记者在绵阳市高新区创业服务中心采访到了该产品的开发团队。只需将手机或录音笔上的录音传到电脑上,点开软件,短短几分钟,录音便能迅速转变为文字,准确率达97%以上。据介绍,一段1小时的录音只用了10多分钟,便完成了翻译,而且每句都分行显示,方便对其进行修改校正。
为什么速度这么快?据开发者介绍,其秘密在于通过独有的声学分析模型,该软件可以像“切片”一样,把长段语音压缩、分包,然后通过云端翻译,从而保证了语音翻译的准确、及时、高效。
受够了整理录音的苦 无奈自主开发软件
据开发团队介绍,目前国内已有一些语音识别软件,但都针对的是短语音。“都是类似于聊天那种,但是能将长文字快速转换为文字的,目前还仅有我们这一款。”开发者黄博说。
黄博曾在机关事业单位工作过,去年科博会期间,整理领导、嘉宾的发言,让他饱尝整理录音之苦。无奈之下,他将解决办法投向语音识别软件,但当时市面上的各种软件都只能针对短语音,而且识别率偏低。
在组建了开发团队后,用时1年才拿出产品。最初团队也曾考虑开发手机端,但受限于硬件条件,录音效果和文字编辑都受到很大限制,最后产品转向PC端。“我们的目标客户也是专业的文字工作者,例如律师、机关事业单位工作人员、记者编辑、作家等。”黄博说。
可以识别多种方言 “可玩性”很高
据介绍,目前该软件对普通话的识别率达到97%,同时还能识别山东话、河南话、粤语等方言,市场潜力较大。
黄博计划在春节前成立专门的公司,以进一步完善和推广该产品,未来将不仅限于文字办公领域,进军语言学习、游戏娱乐等领域。
绵阳创客开发长语音识别平台 1小时语音10分钟转化为文字相关推荐
- 这个AI能帮你快速搜监控:文字定位关键画面,24小时录像10分钟处理完
来源:量子位 现如今,视频监控的存在帮助人们记录了许多过去难以查证的事实. 但想要在24小时不间断的监控里找到那么一两秒的"犯罪现场",依然是一件耗费人力的事. 有没有什么好办法快 ...
- 开发平台之美:10分钟内实现一个销售订单功能的增删改查
IT技术发展了这么多年,早就应该抛弃那些copy&paste的工作了,毫无成就,毫无趣味,毫无好感.这直接催生了一大批快速开发平台的崛起,下面的视频讲述的就是通过一个开发平台如何在10分钟内实 ...
- 阿里IOT云平台(二)---10分钟物联网设备接入阿里云IoT平台
本文转载自:https://www.geek-workshop.com/thread-37883-1-1.html.基于VS Code和Node.js 我替换了原文中的温度.湿度属性图(主要是修正了标 ...
- mysql 分钟转小时_将分钟转化为**小时**分钟,,将秒转化为**天**小时**分钟**秒...
// 分钟转化成多少小时多少分钟 toHourMinute(minutes){ return (Math.floor(minutes/60) + "小时" + (minutes%6 ...
- 百度长语音识别免费开放 大幅提升语音转写效率
当语音输入不再受时光的限制,用户是否可以真正实现"动口不着手"?近日,百度AI开放平台向开辟者免费开放长语音辨认功能,经由过程SDK调用办事,可将长语音转换为文字.据懂得,新版本S ...
- laydate-v5.0.9自定义小时范围和分钟间隔(半小时)
话不多说,先上图,看效果 ,符合自己的需求再往下看. 源码以放,求个积分,自己的积分不够用了.拜谢下载的,没看懂的可以评论或私聊 点我下载源码 说说上图实现的内容:type为datetime类型,1 ...
- 长语音识别体验_如何为语音体验写作
长语音识别体验 重点 (Top highlight) "Voice User Interface (VUI) Designer" is an increasingly promin ...
- 长语音识别_长文本语音识别_语音 识别 - 云+社区 - 腾讯云
广告关闭 腾讯云双11爆品提前享,精选热门产品助力上云,云服务器首年88元起,买的越多返的越多,最高满返5000元! 录音文件识别请求,数据结构,android sdk,ios sdk,自学习模型,使 ...
- 大数据早报:三星Kakao联手开发AI语音识别技术 百度视频8月大数据报告出炉(9.19)
数据早知道,上36dsj看早报! 来源36大数据,作者:奥兰多 『AI』三星和Kakao达成合作 联手开发AI语音识别技术 现如今,越来越多的科技公司选择进入人工智能领域,为了突破人工智能技术上的限制 ...
最新文章
- 当你舌吻十秒后,下面就……
- oracle 树 向上查询,Oracle中显示树结构查询语句【子查父和父查子】
- Windows下 MySQL命令 常用操作
- loadrunner- winsock 函数总结
- shell脚本实战 pdf_Shell脚本实战:日志关键字监控+自动告警
- 【Github开源】一站搞定各种开发文档
- mysql 其他引擎
- (STL,set)安迪的第一个字典
- jdk并发包里常用的类
- WordPress ProfilePress插件多个严重漏洞
- [Objective-C语言教程]数组(14)
- Python包管理器-pip
- 一张模板替代数百Excel,这个工具让报表工作自动进行
- 前端css简易拾色器
- 【华为灰度管理法】之读书思维导图及感想分享
- 重读“发展Linux,中日两国之比较”有感
- 很NB的发现两个linux server 开发人或者站点(back-end-facility,codeday盛大代号:小虾米)
- 小常识:手机被偷后如何让小偷不能用
- 闲暇之余,纪录片推荐(B站)
- 关于文本编辑器的一点思考
热门文章
- Java-面向对象(基础知识)
- 莫言汕大致辞:马云、盖茨毕业之初都没什么了不起
- public protected private
- Winform GDI+
- day2_windows下zip安装wamp环境
- UVA10295 POJ2403 ZOJ1902 Hay Points【map】
- Bailian2719 陶陶摘苹果(POJ NOI0106-02, vijos P1102)【序列处理】
- Matlab Tricks(十二)—— 矩阵阈值化的实现
- 【剑指 offer】(二十九)—— 数组中出现次数超过一半的数字(及该数字出现的次数)
- [面试] C++ 语法(一) —— 初始化列表的初始化顺序