近日,百度AI开放平台向开发者免费开放长语音识别功能,通过SDK调用服务,可将长语音转换为文字。据了解,新版本SDK解除了对时间的限制,开发者无需再将长语音切割成60秒以内的分段,进行调用,提升了转写的效率和语音识别的体验。对于用户来说,新版本告别之前60秒的“束缚”,可根据需要自行把控时间,极大地提高了灵活性。

目前,开发者多通过第三方接入语音识别技术,以减少研发时间、降低研发成本。但是,大部分公司提供的语音识别功能有时间限制,类似会议录音、长语句等长语音识别成了难题,虽然市面上存在一些长语音识别技术支持方,但开发者需要为此支付大笔的技术接入费用,徒增业务成本。

百度基于原有语音识别技术,新增长语音识别功能,让语音识别不再局限于60秒,并且为开发者免费开放。比如开发者可将长语音识别用于会议记录、实时字幕和语音笔记等场景,让产品实现不同时长的音频转换为文字信息,或将直播、视频、现场演讲等音频进行实时字幕转换等功能,方便后期文字处理和内容存档,省去记录的人力和时间成本,大幅提升了转换效率,给予开发者和用户更好的使用体验。

据了解,作为全球最早进军人工智能领域的公司之一,百度早在2010年就已经开始智能语音及相关技术研发,分别于2014年和2015年年底发布了深度语音识别系统Deep Speech和Deep Speech 2。该系统使用“端对端”的深度学习技术,在噪音环境下的表现比谷歌、微软以及苹果的语音系统更好。同时,百度凭借深度语音识别技术于 2016年入选MIT十大突破技术。2017年初,百度推出网页应用SwiftScribe,它能将音频文件转为文本,30秒内就可转换完成时长1分钟的音频文件,转化效率较人工速记快1.67倍,极大提升速记行业转录效率,加速语音行业的发展。

百度免费开放长语音识别功能相关推荐

  1. GitHub免费开放所有核心功能;告别纸币-央行牵头数字货币

    行 业 要 闻 Industry   News ▲▲▲ 0 1 一次登录,终身免费:GitHub宣布向所有人免费开放所有核心功能 每个私有库合作人数不设限,所有核心功能向所有人免费开放,这是 GitH ...

  2. 重磅!GitHub突然宣布,对全球人免费开放全部核心功能

    程序员的成长之路 互联网/程序员/技术/资料共享 关注 阅读本文大概需要 5 分钟. 来自:扩展迷EXTFANS 4月15日,GitHub发布公告称,已面向全体GitHub用户和团队提供不限制协作人数 ...

  3. 基于百度AI平台的语音识别功能开发-SDK调用

    文章目录 一.前期工作 二.调用百度语音SDK,基于python3 一.前期工作 1.拥有一个百度智能云账号 2.创建一个语音应用,创建成功后会显示有一个应用 3.在应用列表里查看自己的应用 强调: ...

  4. 福利!百度免费开放内部云原生精品课程

    近年来,云原生的关注度居高不下,全世界的开发者都对由此而兴起的一众技术十分追捧,中国的开发者们也经历了从关注"云原生概念"到关注"云原生落地实践"的转变.在企业 ...

  5. 百度AI长语音识别技术免费开放,调用时长不再受限

    原标题:百度AI长语音识别技术免费开放,调用时长不再受限 前几天看到一条祝福:祝大家早日成为可以在公司群里随心所欲发语音的人 . 显然,微信群聊(特别是家族群.客户群.公司群)里的语音消息,并不是谁想 ...

  6. 百度长语音识别免费开放 大幅提升语音转写效率

    当语音输入不再受时光的限制,用户是否可以真正实现"动口不着手"?近日,百度AI开放平台向开辟者免费开放长语音辨认功能,经由过程SDK调用办事,可将长语音转换为文字.据懂得,新版本S ...

  7. Android 悬浮窗语音识别功能开发详解

    笔者是一个普通不能再普通的程序员,本着出处兴趣,花时间研究了一下,想实现手机的悬浮窗语音识别功能,这样不影响自己其它操作的,语音识别技术是用百度云语音sdk,应该不难实现,很难实现就是核心语音识别技术 ...

  8. 阿里云免费开放一切AI算力,加速新型冠状病毒新药和疫苗研发

    近日,阿里云宣布,为了帮助加速新药和疫苗研发,将向全球公共科研机构免费开放一切AI算力. 目前,中国疾控中心已成功分离病毒,疫苗研发和药物筛选仍在争分夺秒地进行.新药和疫苗研发期间,需要进行大量的数据 ...

  9. Android 调用百度在线语音识别功能

    换了好几个语音转文字的工具,主要跟百度上大家的方法一样,最开始用的科大讯飞的语音,真的还蛮好用的,整体来说demo的接口比较清晰吧~准确率也很高,但是量大就要收费.所以,换了第二种,Android原生 ...

最新文章

  1. OSChina 周六乱弹 ——土肥圆装高富帅相亲节目现场拆穿
  2. JavaScript社区开发者调查:服务端JS盛行 AngularJS使用者最多
  3. 区块链开源实现 hyperledger fabric 概念与原理
  4. Linux监控实时log
  5. ACCESS的System.Data.OleDb.OleDbException: INSERT INTO 语句的语法错误
  6. Wordpress卡在 wp-admin/setup-config.php,一片空白
  7. “由于应用程序配置不正确,应用程序未启动。重新安装应用程序可能会纠正这个问题。”解决思路
  8. Android 集成google地图
  9. 尊诺百度SEO快速排名、发包、模拟点击软件
  10. 号称全网最全CAD组合键功能详解
  11. Java8新特性——Lambda函数式编程
  12. java并发编程第二课 线程锁和线程安全
  13. 【BSP视频教程】STM32H7视频教程第2期:STM32H7四通八达的总线矩阵,从系统框架整体把控H7
  14. 5、多线程:龟兔赛跑
  15. 扎好篱笆桩:三大运营商守住网络安全“命门”
  16. 黑夜给了我黑色的眼睛,我用它来寻找黑夜
  17. 宿主机使用wifi时虚拟机如何连网
  18. C#重写RichBox控件获取RTF格式的内容
  19. php实现挖掘百度相关词,百度相关搜索关键词采集即长尾关键词挖掘脚本
  20. IdentityServer4 (IDS4) UI界面使用

热门文章

  1. 八 Civil3d常用显示样式的编辑与创建 ----点标签样式2
  2. 前台传JSON到后台
  3. laravel框架学习(三)
  4. undefined reference to '__android_log_print'解决方案
  5. Delphi常用字符串函数
  6. Gadget,又见Gadget - 浅尝Windows Live Contacts Gadget
  7. UVA489 Hangman Judge【模拟】
  8. 红黑树相关定理及其证明
  9. 中英文对照 —— 色彩的描述
  10. 1 + 2 + 3 + 4 + ⋯