本发明涉及语音识别技术领域,特别涉及一种基于百度AI的网页版在线语音包转文字的方法。

背景技术:

语音识别技术,也被称为自动语音识别Automatic Speech Recognit1n, (ASR),其目标是将人类的语音中的词汇内容转换为计算机可读的输入。

但是,目前面临的主要问题有:

在以往的想要将一段语音包中的语音转换为文字时,往往都需要手动的多次播放和聆听语音包并将语音记录为文字,或下载各种软件提供语音转文字的技术支持等,缺乏一种实时、高效、在线、低成本的网页版的将语音包转换为文字的方法。

技术实现要素:

本发明解决了在以往的想要将一段语音包中的语音转换为文字时,往往都需要手动的多次播放和聆听语音包并将语音记录为文字,或下载各种软件将语音转文字等,本发明提供了一种实时、高效、在线、低成本的网页版的将语音包转换为文字的方法。

本发明解决上述技术问题的技术方案是:

所述的方法包含以下几个步骤:

步骤一、下载百度AI的语音识别SDK;

步骤二、创建一个html页面,并定义需要的标签;

步骤三、利用js检测用户上传的语音包的类型,并判断是否为合法类型;

步骤四、用户点击上传时,服务器对上传的文件进行处理;

步骤五、服务器调用百度AI提供的方法对用户上传的语音包检测,并将结果转换返回给用户;

本发明的有益效果:提供了一种实时、高效、在线、低成本的网页版的将语音包转换为文字的方法。

附图说明

下面结合附图对本发明进一步说明:

图1为本发明的方法流程图。

具体实施方式

如图1所示,本发明采用如下步骤可以实现一种基于百度AI的网页版在线语音包转文字的方法。

步骤一、下载百度AI的语音识别SDK,下载百度AI提供的SDK,本专利使用node.js做服务器,需要安装node和express依赖包和formidable中间件。

步骤二、创建一个html页面,并定义需要的标签;

步骤三、利用js检测用户上传的语音包的格式,并判断是否为合法格式;

var flag = false;

function changFn(obj){

var exe = obj.files[0].name.split(".").splice(-1);

var arr = ["pcm", "wav", "amr"];

$.each(arr, function(i){

if(exe == arr[i]){

flag = true;

return false;

}

});

if(!flag){

alert("上传的文件格式非法");

}

}

步骤四、用户点击上传时,服务器对上传的文件进行处理;

const fs = require('fs');

const path = require("path");

const http = require("http");

const formidable = require('formidable');

const express = require("express");

const app = express();

app.post("/uploadFile", function(req, res, next){

var form = new formidable.IncomingForm();

form.uploadDir = path.join(__dirname, "./statics/audio");

form.parse(req, function (err, fields, files) {

var oldPath = files.file.path;

var extname = path.extname(files.file.name);

var newPath = path.join(__dirname, "./statics/audio/", parseInt(Math.random()*10000000) + extname);

fs.rename(oldPath, newPath, function (err) {

if (err) { res.send("上传失败"); return; }

console.log("上传成功");

transformYY(res, newPath);

});

});

});

http.createServer(app).listen(3000,"127.0.0.1");

步骤五、服务器调用百度AI提供的方法对用户上传的语音包检测转换,并将转换结果以文字形式返回给用户;

var AipSpeechClient = require("baidu-aip-sdk").speech;

// 设置APPID/AK/SK

var APP_ID = "您百度AI的APP_ID";

var API_KEY = "您百度AI的API_KEY";

var SECRET_KEY = "您百度AI的SECRET_KEY";

function transformYY(res,newPath){

let filePath = fs.readFileSync(newPath);

let fileBuffer = new Buffer(filePath );

client.recognize(fileBuffer , 'pcm', 16000).then(function (result) {

res.send(result['result']);

}, function(err) {

console.log(err);

});

}。

百度ai文字转语音并下载php源码,一种基于百度AI的网页版在线语音包转文字的方法与流程...相关推荐

  1. 百度网盘直接解析高速下载文件源码

    介绍: 百度网盘直接高速下载文件源码 上传源码 访问域名跳转安装页面填写相关信息 安装完成 源码功能: 通过curl获取网盘文件信息,处理后显示在网页中. 通过api接口以及SVIP账号的Cookie ...

  2. AOSP: 下载 android 源码

    很高兴,今天与android开发网站,源码网站都扯上关系啦,虽然有点爬山涉水,但还是大大的值得,呵呵!! 小结下载源码的方法,来自http://source.android.com/source/do ...

  3. Thinkphp开发的云盘宝网盘赚钱系统源码/仿蓝奏百度网盘限速下载系统/分享赚钱网盘系统

    演示地址:http://www.xhymsq.com/thread-27590-1-1.html 源码说明:Thinkphp开发的云盘宝网盘赚钱系统源码/仿蓝奏百度网盘限速下载系统/分享赚钱网盘系统, ...

  4. windows平台下载android源码

    最近在看<android内核剖析>,很多细节不具体看代码很难理解,记住了印象也不深,感觉还是跟着源码走一遍好些,回来下载android源码,遇到不少问题,终于开始下载了,整理下流程,鉴于网 ...

  5. 下载论坛源码GBK UTF8 BIG5分别是什么意思

    下载论坛源码GBK UTF8 BIG5分别是什么意思? 提问者:ly1987520 | 浏览次数:4010次 下载论坛源码简体中文GBK 简体中文UTF8 繁体中文BIG5 分别是什么意思?他们的区别 ...

  6. 3D语音天气球(源码分享)——完结篇

    转载请注明本文出自大苞米的博客(http://blog.csdn.net/a396901990),谢谢支持! 开篇废话: 由于这篇文章是本系列最后一篇,有必要进行简单的回顾和思路整理. 这个程序是由两 ...

  7. 3D语音天气球(源码分享)本文出自大苞米的博客(http://blog.csdn.net/a396901990)

    开篇废话: 由于这篇文章是本系列最后一篇,有必要进行简单的回顾和思路整理. 这个程序是由两部分组成,Android端和Unity端: 1.Unity端负责3D球的创建,显示和旋转:3D语音天气球(源码 ...

  8. python爬虫05 - BeautifulSoup4的安装,下载,源码简介,使用。

    1. bs4简介 1.1 基本概念 Beautiful Soup 是一个可以从HTML或XML文件中提取数据的网页信息提取库 1.2 源码分析 • github下载源码 • 安装 • pip inst ...

  9. AI智能配音助手微信小程序源码支持多种声音场景选择

    大家好今天给大家带来一款配音小程序 这款小程序支持多种不同声音和场景的选择更人性化 比如说支持各地区的方言,英文,童声呀等等 另外也支持男声女声的选择,反正就是模板那些非常的多 当然啦音量,语调,语速 ...

最新文章

  1. 管道通信C语言,Go语言通道(chan)——goroutine之间通信的管道
  2. 25个视频神同步,还能给视频声音移花接木,谷歌开源最新自监督算法
  3. 从零开始学习docker(十四)Docker Compose--部署SpringCloud
  4. c语言函数的使用步骤,c语言打开文件函数使用方法
  5. range 小程序picker_小程序开发讲义【入门篇】 03
  6. Nagios客户端的安装步骤(要监控的服务器)
  7. Flex和Flash之间相互调用
  8. mysql 避免临时表_MySQL 5.7临时表空间如何玩才能不掉坑里详解
  9. 在PKM2 / CyberArticle / MetaProducts Inquiry / 网博士 中选择了网博士。 :)
  10. vue引入iconfont阿里矢量图库
  11. 小白入门Python-第一课
  12. python 异常 exception_关于Python中异常(Exception)的汇总
  13. 机会总是留给有准备的人 —— 从裁缝到码农
  14. PGM学习之四 Factor,Reasoning
  15. APOLLO基本介绍
  16. html+input+js双击,JS双击变input框批量修改内容
  17. Dubbo之服务导入流程解析
  18. 鸿蒙桌面系统什么时候上线,鸿蒙OS全新PC桌面模式即将上线?回顾一下手机桌面系统的发展历程...
  19. sort函数用法使用lambda表达式自定义sort排序方法
  20. 【Linux】压缩与解压zip

热门文章

  1. 见到了故事中的人,搜狗输入法之父:马占凯
  2. 基于SpringBoot的便捷网住宿预约系统的设计与实现
  3. aPaaS和iPaaS的区别
  4. 利用开天aPaaS平台实时查询出行城市防疫策略
  5. 物联网 MQTT 协议
  6. linux logstash启动脚本,在Linux中从bash脚本启动时Logstash shutdown停止
  7. htc x920e刷android7.0,HTC X920E (Butterfly) 刷回官方RUU固件教程
  8. 毕业论文管理系统的设计与实现
  9. 高仿大企业简洁响应电子商务网站模板 带后台 自适应版本 安卓+PC
  10. Java开发技巧!java语言程序设计第四版答案