百度ai文字转语音并下载php源码,一种基于百度AI的网页版在线语音包转文字的方法与流程...
本发明涉及语音识别技术领域,特别涉及一种基于百度AI的网页版在线语音包转文字的方法。
背景技术:
语音识别技术,也被称为自动语音识别Automatic Speech Recognit1n, (ASR),其目标是将人类的语音中的词汇内容转换为计算机可读的输入。
但是,目前面临的主要问题有:
在以往的想要将一段语音包中的语音转换为文字时,往往都需要手动的多次播放和聆听语音包并将语音记录为文字,或下载各种软件提供语音转文字的技术支持等,缺乏一种实时、高效、在线、低成本的网页版的将语音包转换为文字的方法。
技术实现要素:
本发明解决了在以往的想要将一段语音包中的语音转换为文字时,往往都需要手动的多次播放和聆听语音包并将语音记录为文字,或下载各种软件将语音转文字等,本发明提供了一种实时、高效、在线、低成本的网页版的将语音包转换为文字的方法。
本发明解决上述技术问题的技术方案是:
所述的方法包含以下几个步骤:
步骤一、下载百度AI的语音识别SDK;
步骤二、创建一个html页面,并定义需要的标签;
步骤三、利用js检测用户上传的语音包的类型,并判断是否为合法类型;
步骤四、用户点击上传时,服务器对上传的文件进行处理;
步骤五、服务器调用百度AI提供的方法对用户上传的语音包检测,并将结果转换返回给用户;
本发明的有益效果:提供了一种实时、高效、在线、低成本的网页版的将语音包转换为文字的方法。
附图说明
下面结合附图对本发明进一步说明:
图1为本发明的方法流程图。
具体实施方式
如图1所示,本发明采用如下步骤可以实现一种基于百度AI的网页版在线语音包转文字的方法。
步骤一、下载百度AI的语音识别SDK,下载百度AI提供的SDK,本专利使用node.js做服务器,需要安装node和express依赖包和formidable中间件。
步骤二、创建一个html页面,并定义需要的标签;
步骤三、利用js检测用户上传的语音包的格式,并判断是否为合法格式;
var flag = false;
function changFn(obj){
var exe = obj.files[0].name.split(".").splice(-1);
var arr = ["pcm", "wav", "amr"];
$.each(arr, function(i){
if(exe == arr[i]){
flag = true;
return false;
}
});
if(!flag){
alert("上传的文件格式非法");
}
}
步骤四、用户点击上传时,服务器对上传的文件进行处理;
const fs = require('fs');
const path = require("path");
const http = require("http");
const formidable = require('formidable');
const express = require("express");
const app = express();
app.post("/uploadFile", function(req, res, next){
var form = new formidable.IncomingForm();
form.uploadDir = path.join(__dirname, "./statics/audio");
form.parse(req, function (err, fields, files) {
var oldPath = files.file.path;
var extname = path.extname(files.file.name);
var newPath = path.join(__dirname, "./statics/audio/", parseInt(Math.random()*10000000) + extname);
fs.rename(oldPath, newPath, function (err) {
if (err) { res.send("上传失败"); return; }
console.log("上传成功");
transformYY(res, newPath);
});
});
});
http.createServer(app).listen(3000,"127.0.0.1");
步骤五、服务器调用百度AI提供的方法对用户上传的语音包检测转换,并将转换结果以文字形式返回给用户;
var AipSpeechClient = require("baidu-aip-sdk").speech;
// 设置APPID/AK/SK
var APP_ID = "您百度AI的APP_ID";
var API_KEY = "您百度AI的API_KEY";
var SECRET_KEY = "您百度AI的SECRET_KEY";
function transformYY(res,newPath){
let filePath = fs.readFileSync(newPath);
let fileBuffer = new Buffer(filePath );
client.recognize(fileBuffer , 'pcm', 16000).then(function (result) {
res.send(result['result']);
}, function(err) {
console.log(err);
});
}。
百度ai文字转语音并下载php源码,一种基于百度AI的网页版在线语音包转文字的方法与流程...相关推荐
- 百度网盘直接解析高速下载文件源码
介绍: 百度网盘直接高速下载文件源码 上传源码 访问域名跳转安装页面填写相关信息 安装完成 源码功能: 通过curl获取网盘文件信息,处理后显示在网页中. 通过api接口以及SVIP账号的Cookie ...
- AOSP: 下载 android 源码
很高兴,今天与android开发网站,源码网站都扯上关系啦,虽然有点爬山涉水,但还是大大的值得,呵呵!! 小结下载源码的方法,来自http://source.android.com/source/do ...
- Thinkphp开发的云盘宝网盘赚钱系统源码/仿蓝奏百度网盘限速下载系统/分享赚钱网盘系统
演示地址:http://www.xhymsq.com/thread-27590-1-1.html 源码说明:Thinkphp开发的云盘宝网盘赚钱系统源码/仿蓝奏百度网盘限速下载系统/分享赚钱网盘系统, ...
- windows平台下载android源码
最近在看<android内核剖析>,很多细节不具体看代码很难理解,记住了印象也不深,感觉还是跟着源码走一遍好些,回来下载android源码,遇到不少问题,终于开始下载了,整理下流程,鉴于网 ...
- 下载论坛源码GBK UTF8 BIG5分别是什么意思
下载论坛源码GBK UTF8 BIG5分别是什么意思? 提问者:ly1987520 | 浏览次数:4010次 下载论坛源码简体中文GBK 简体中文UTF8 繁体中文BIG5 分别是什么意思?他们的区别 ...
- 3D语音天气球(源码分享)——完结篇
转载请注明本文出自大苞米的博客(http://blog.csdn.net/a396901990),谢谢支持! 开篇废话: 由于这篇文章是本系列最后一篇,有必要进行简单的回顾和思路整理. 这个程序是由两 ...
- 3D语音天气球(源码分享)本文出自大苞米的博客(http://blog.csdn.net/a396901990)
开篇废话: 由于这篇文章是本系列最后一篇,有必要进行简单的回顾和思路整理. 这个程序是由两部分组成,Android端和Unity端: 1.Unity端负责3D球的创建,显示和旋转:3D语音天气球(源码 ...
- python爬虫05 - BeautifulSoup4的安装,下载,源码简介,使用。
1. bs4简介 1.1 基本概念 Beautiful Soup 是一个可以从HTML或XML文件中提取数据的网页信息提取库 1.2 源码分析 • github下载源码 • 安装 • pip inst ...
- AI智能配音助手微信小程序源码支持多种声音场景选择
大家好今天给大家带来一款配音小程序 这款小程序支持多种不同声音和场景的选择更人性化 比如说支持各地区的方言,英文,童声呀等等 另外也支持男声女声的选择,反正就是模板那些非常的多 当然啦音量,语调,语速 ...
最新文章
- 管道通信C语言,Go语言通道(chan)——goroutine之间通信的管道
- 25个视频神同步,还能给视频声音移花接木,谷歌开源最新自监督算法
- 从零开始学习docker(十四)Docker Compose--部署SpringCloud
- c语言函数的使用步骤,c语言打开文件函数使用方法
- range 小程序picker_小程序开发讲义【入门篇】 03
- Nagios客户端的安装步骤(要监控的服务器)
- Flex和Flash之间相互调用
- mysql 避免临时表_MySQL 5.7临时表空间如何玩才能不掉坑里详解
- 在PKM2 / CyberArticle / MetaProducts Inquiry / 网博士 中选择了网博士。 :)
- vue引入iconfont阿里矢量图库
- 小白入门Python-第一课
- python 异常 exception_关于Python中异常(Exception)的汇总
- 机会总是留给有准备的人 —— 从裁缝到码农
- PGM学习之四 Factor,Reasoning
- APOLLO基本介绍
- html+input+js双击,JS双击变input框批量修改内容
- Dubbo之服务导入流程解析
- 鸿蒙桌面系统什么时候上线,鸿蒙OS全新PC桌面模式即将上线?回顾一下手机桌面系统的发展历程...
- sort函数用法使用lambda表达式自定义sort排序方法
- 【Linux】压缩与解压zip
热门文章
- 见到了故事中的人,搜狗输入法之父:马占凯
- 基于SpringBoot的便捷网住宿预约系统的设计与实现
- aPaaS和iPaaS的区别
- 利用开天aPaaS平台实时查询出行城市防疫策略
- 物联网 MQTT 协议
- linux logstash启动脚本,在Linux中从bash脚本启动时Logstash shutdown停止
- htc x920e刷android7.0,HTC X920E (Butterfly) 刷回官方RUU固件教程
- 毕业论文管理系统的设计与实现
- 高仿大企业简洁响应电子商务网站模板 带后台 自适应版本 安卓+PC
- Java开发技巧!java语言程序设计第四版答案