语音转文字

  • 百度智能云
  • JAVA代码实现

考虑到在识别mp3文件是否有声音之后,后续会做语音转文字这些功能
就提前去搜索了一下,貌似基本只能靠第三方来实现

百度智能云

1.创建一个百度/百度智能云用户,有的直接登录就行
2.进入右上角管理控制台
3.产品服务里面找到语音技术4.
里面有多重方式

因为这里限制了语音时长,所以就不考虑,如果符合要求可以考虑这个

继续找

这里就满足需求了

去下载demo,然后创建应用 ,提前领取免费的接口额度,虽然时间不长,足够测试用了

创建好之后会有个应用列表,里面有appID ,APIkey, Secret Key ,之后都会用到

JAVA代码实现

因为我是springboot项目,所以在pom.xml里面引入了依赖包

     <dependency><groupId>com.squareup.okhttp3</groupId><artifactId>okhttp</artifactId><version>4.2.1</version></dependency><!-- 引入org.json所需依赖 --><dependency><groupId>org.json</groupId><artifactId>json</artifactId><version>20190722</version></dependency>

然后把demo里面的代码拷贝过来

修改Const 里面的配置信息 ,这里就用到了自己应用管理里面给你分配的

public interface Const {/* 下面2个是鉴权信息 ,具体参数在sendStartFrame() 方法内 */int APPID = APPID ;String APPKEY = "APPKEY ";/* dev_pid 是语言模型 , 可以修改为其它语言模型测试,如远场普通话 19362*/int DEV_PID = 15372;/* 可以改为wss:// */String URI = "ws://vop.baidu.com/realtime_asr";
}

接着发现文档描述的只支持pcm格式的音频文件
还好我提前去了解了一下sound包里面的audioInputStream
这里可以参考我上一篇写的
Java判断mp3文件是否有声音

使用inputStream 的子类audioInputStream 然后再配置format

测试:


这里测试成功,能成功读取mp3里面内容

这里我用了工具Audacity把pcm文件转成mp3文件
不知道会不会有影响
有空我再去测一下其他mp3文件
当然这个文档也标明了嘈杂的环境等可能会对识别有影响
这篇文章应该是不完善的,只是提供一个思路
新手发帖,希望多多提一下宝贵的意见和建议,谢谢

Java语音转文字功能相关推荐

  1. Flutter学习第十三天,2021最新版超详细Flutter2.0实现百度语音转文字功能,Android和Flutter混合开发?

    Flutter实现百度语音转文字功能 1.新建一个flutter项目,来实现View端. 2.新建android端的module 1.打开flutter里面的Android文件 1.新建一个modul ...

  2. 三大运营商回复 4G 降速;微信上线语音转文字功能;IntelliJ IDEA 2019.2.1 发布 | 极客头条...

    快来收听极客头条音频版吧,智能播报由标贝科技提供技术支持. 「CSDN 极客头条」,是从 CSDN 网站延伸至官方微信公众号的特别栏目,专注于一天业界事报道.风里雨里,我们将每天为朋友们,播报最新鲜有 ...

  3. 华为语音解锁设置_华为手机免费语音转文字功能如何开启?手把手教你如何设置,超赞...

    原标题:华为手机免费语音转文字功能如何开启?手把手教你如何设置,超赞 关于华为手机免费语音转文字功能,相信你也有所了解,但还有很大部份华为手机用户表示:我的手机为什么没有语音转文字的功能. 如果你是华 ...

  4. 知意字稿的语音转文字功能真的好用吗?

    知意字稿是知意配音的姐妹产品,我是刚好买了知意配音的永久会员送了一些时长,刚开始觉得没啥用,我一个做短视频的,很少会用到.直到最近开始写论文,让别人帮我录制了老师的指导内容,大概有半个小时,自己听觉得 ...

  5. Qt --实现语音读文字功能

    目的:实现语音读文字功能 .h #ifndef MAINWINDOW_H #define MAINWINDOW_H#include <QMainWindow> #include <Q ...

  6. Android studio调用科大讯飞的语音转文字功能

    Android studio调用科大讯飞的语音转文字功能 一.在科大讯飞的官网上注册并下载SDK 二.配置安卓项目 三.运行效果展示 一.在科大讯飞的官网上注册并下载SDK 1.首先去讯飞开放平台申请 ...

  7. java 语音转文字解决方案

    Java语音转文字解决方案有很多, 主要有三种: 使用第三方语音识别库,例如: CMU Sphinx, Kaldi, HTK等. 使用第三方云服务,例如: 腾讯云.阿里云.百度云等提供的语音识别API ...

  8. Unity3D : 腾讯云语音(GCloudVoice)的语音转文字功能

    前言: 关于GCloudVoice的Unity3D接入,可以参考其他文章,不在本文的讨论 范围之内.这篇只针对在正常接入的前提下,如果实现语音转文字的相关功能: 正文: 1.初始化: 在最开始初始化的 ...

  9. Java 语音转文字

    最近变懒了,连做读书笔记都不想打字了,于是找了一下网上看看有木有语音转文字的工具,发现 windows 自家就有啊,但是准确率惊人啊,所以心血来潮就开搞了,这里用到了讯飞的语音转文字服务 1.到讯飞开 ...

  10. win10如何使用语音输入文字功能?(语音识别)

    win+q搜索"语音识别" 这识别实在是太烂了.....换一个吧 下了个讯飞输入法

最新文章

  1. Jetty 基本使用样例
  2. python 编译器重构_Python之父考虑重构Python解释器
  3. 使用多线程一定提高效率吗?
  4. 中国CMOS图像传感器行业运行状况与应用前景调研报告2022版
  5. 设计模式学习(六)结构型模式初步了解
  6. IPSEC的NAT兼容性
  7. HBase 基本Java API
  8. 使用sar进行性能分析
  9. window服务器上搭建git服务,window server git!!!
  10. web开发 开发一个能发送邮件的应用
  11. 日常记录(4)让百度和google收录我们的网站
  12. Python守护进程
  13. 27. Remove Element
  14. 破解WinRAR广告
  15. 查阅国外文献的网站有哪些?
  16. 顺序表实验——顺序表的基本操作
  17. 屏幕缩放比例 html,css如何自适应屏幕大小?
  18. mysql怎么安装安全补丁_讲解SQL Server安装sp4补丁报错的解决方法_MySQL
  19. 蒋文华《博弈论》笔记及视频摘录
  20. TalkingData :如何做到30分钟内完成对数十亿受众数据的分析 | 会员专栏

热门文章

  1. 【教程】Win10安装SQLServer2005出现服务启动失败的问题解决
  2. Oracle数据库下载安装教程
  3. C#旅程——ListView控件使用
  4. 最好用的UltraISO 9.5.3.2901中文完美注册破解版
  5. Adodb CS3(DW、FW、PS、FLASH)安装序列号
  6. 概率论与数理统计浙大第五版 第三章 部分习题
  7. python爬虫模拟登陆校园网+连接校园wifi
  8. 5星好书———电子技术基础数字部分(第6版)
  9. 通过ip地址定位计算机,局域网通过IP地址如何找到电脑的位置
  10. 基于matlab的2ASK调制解调仿真