Google的语音识别API,支持各种语言
废话多了,现在看看Google的猥琐API之STT!(属于speech-api v1的recognize)
http://www.google.com/speech-api/v1/recognize?xjerr=1&client=chromium&lang=zh-CN
不过使用不是那么简单的哦……
如何调用
要使用这个API,你得先有一些心理素质:面对倒霉的FLAC格式,因为这个API只支持FLAC格式的数据,杯具啊。
不过你找到了我的博客,那么你是幸福的,因为我已经为你准备了不少好东西了。(顺便说一句,如果要转载记得清楚地标注“来自http://blog.laobubu.net”,我信任你。)
现在看看如何请求数据:
- 【URL】http://www.google.com/speech-api/v1/recognize?xjerr=1&client=chromium&lang=zh-CN
- 【方式】POST
- 【请求头】Content-Type:audio/x-flac; rate=16000
- 【POST】flac文件的数据
- 【URL里可选参数】&maxresults=返回结果数
如果你人品大爆发,你成功了,可以得到类似这个的结果
{"status":0,"id":"54e1babccaa58682ffbb02ceb42aa47c-1", "hypotheses":[{"utterance":"测试程序","confidence":0.8556527}]}或者你的请求URL里设置了maxresults(比如 http://www.google.com/speech-api/v1/recognize?xjerr=1&client=chromium&lang=zh-CN&maxresults=10 )你就会得到:
{"status":0,"id":"fbf23a887b9ac2bfb630aa40dd1a776c-1","hypotheses": [ {"utterance":"欢迎访问过的网址","confidence":0.7275984}, {"utterance":"欢迎访问我的网站"}, {"utterance":"欢迎访问我的网址"}, {"utterance":"欢迎访问过的网站"}, {"utterance":"白云访问过的网址"}, {"utterance":"怀孕访问过的网址"}, {"utterance":"欢迎访问有的网址"}, {"utterance":"欢迎访问过的网址哦"}, {"utterance":"白云访问我的网站"}, {"utterance":"怀孕访问我的网站"} ] }不过不简单哦
实例
Python代码
#By laobubu.netimport urllib2FILE='1.flac' #这里假设在当前文件夹下有一个叫1.flac的文件被识别url = 'http://www.google.com/speech-api/v1/recognize?xjerr=1&client=chromium&lang=zh-CN'audio=open(FILE,'rb').read()headers = {'Content-Type' : 'audio/x-flac; rate=16000'}req = urllib2.Request(url, audio, headers)response = urllib2.urlopen(req)print response.read().decode('UTF-8')PHP代码
$ch = curl_init(); curl_setopt($ch, CURLOPT_URL, "http://www.google.com/speech-api/v1/recognize?xjerr=1&client=chromium&lang=zh-CN&maxresults=10"); curl_setopt($ch, CURLOPT_VERBOSE, 0); curl_setopt($ch, CURLOPT_HEADER, 0); curl_setopt($ch, CURLOPT_POST, 1); curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1); curl_setopt($ch, CURLOPT_POSTFIELDS, file_get_contents('1.flac')); curl_setopt($ch, CURLOPT_HTTPHEADER, array("Content-Type: audio/x-flac; rate=16000")); $data = curl_exec($ch); curl_close($ch); if ($data=json_decode($data,true)) {echo "<ul>";foreach($data['hypotheses'] as $i) echo "<li>".$i['utterance']."</li>";echo "</ul>"; } else {echo "<i>识别出错</i>"; }
头疼:FLAC文件格式
这里我长话短说,google的flac也有限制,22050 Hz+201kbps还正常,如果比这个大多了就不对了。
不过还有最要命的问题,怎么生成FLAC文件?
没关系,这里有救星:flac.exe包下载
http://datastorage.laobubu.net/FLAC.zip
具体使用方法是【flac.exe 文件.wav】这样在命令行调用即可,测试得知:不支持MP3等格式,但是支持基本的wav格式。
至于其他环境下(如linux里)也有对应的flac下载。我没有怎么用过linux就不说啥了。
好了,你可以去制造你的app了,哈哈。
来自laobubu实验室自动转换API
为了方便,我写了一个python程序,放在Google App Engine上面,只要提交一个音频文件的URL(支持MP3、wav等常见格式),且文件不大,就可以得到结果了哦。
API入口:http://laobubumf.appspot.com/stt/
备用入口:http://glab.laobubu.net/stt/
原文地址:http://blog.laobubu.net/546
转载于:https://www.cnblogs.com/hyb1/articles/3048756.html
Google的语音识别API,支持各种语言相关推荐
- python语言实例-Python语言实现百度语音识别API的使用实例
未来的一段时间,人工智能在市场上占有很重的位置,Python语言则是研究人工智能的最佳编程语言,下面,就让我们来感受一下它的魅力吧! 百度给的样例程序,不论C还是Java版,都分为method1和me ...
- 用python语言实现-Python语言实现百度语音识别API的使用实例
未来的一段时间,人工智能在市场上占有很重的位置,Python语言则是研究人工智能的最佳编程语言,下面,就让我们来感受一下它的魅力吧! 百度给的样例程序,不论C还是Java版,都分为method1和me ...
- sql c语言api,SQL Anywhere C API 支持
SQL Anywhere C API 支持 SQL Anywhere C 应用程序编程接口 (API) 是 C/C++ 语言的数据访问 API.C API 规范定义了一组函数.变量和约定,这些函数.变 ...
- 谷歌云端语音识别助手手机版-Google云端语音识别app1.0.0 官方安卓版-东坡下载...
Google云端语音识别app是由谷歌最新研发的手机语音识别软件,该软件支持全球80多中语音识别系统,十分的强大,支持中文.粤语.普通话等,不通国家的语言,可以通过该软件进行交流,十分的方便哦,欢迎有 ...
- 谷歌发布机器学习云平台 开放语音识别API
[天极网IT新闻频道]Google Next云计算大会在美国旧金山召开.Google在本次大会上发布了面向开发者的新机器学习平台,并开放语音识别的API(应用程序编程接口),该机器学习平台将在初期免费 ...
- 谷歌开放语音识别 API,发力人工智能
谷歌Next云计算大会今日在美国旧金山召开.谷歌在会上发布了面向开发者的新机器学习平台,并开放语音识别的API(应用程序编程接口).机器学习平台初期将免费提供给开发者.谷歌母公司Alphabet董事长 ...
- Google云端语音识别app
Google云端语音识别app是谷歌最新推出发一款手机语音识别软件,支持全球80多种语音识别系统,其中,中文也在被支持之列,包括普通话.粤语.喜欢的朋友赶紧下载吧. Google云端语音识别app简介 ...
- 微软牛津计划介绍——屌爆了的自然数据处理解决方案(人脸/语音识别,计算机视觉与语言理解)...
微软在机器学习与自然语言处理方面积累了大量的资料,同时近1年来,也逐步开放了大量的在线资源.例如在我博客前几个月介绍的Infer.NET项目就是其中1个项目.今天给大家介绍的是"微软牛津计划 ...
- python 语音识别机器人控制系统_python实现百度语音识别api
本文实例为大家分享了python实现百度语音识别的具体代码,供大家参考,具体内容如下 详细百度语音识别api文档 先下载python用SDK,可以用python setup.py install安装 ...
- 特大动作:OLAMI 在线语音识别 API SDK 上线!
原标题:特大动作:OLAMI 在线语音识别 API & SDK 上线! 最新消息,欧拉蜜人工智能开放平台更新了两项重要功能:在线语音识别 API及SDK(软件开发工具包)下载. 此举意味着,欧 ...
最新文章
- iOS UI基础-6.0 UIActionSheet的使用
- StringUtils类中 isEmpty() 与 isBlank()的区别
- 推荐搜索炼丹笔记:MiNet阿里跨域点击率CTR预估
- 2440 休眠唤醒的实现过程(作者:wogoyixikexie@gliet)
- jquery数组(排序)
- python redis模块connectionerror_PHP程序连接Redis报read error on connection问题
- 2021年小红书美妆护肤品类行业洞察报告
- 面面俱到的Java接口自动化测试实战
- PHP header发送各种类型文件下载
- 糍粑大叔的独游之旅-u3d实现弹出菜单(上)-动态列表
- 文件的长度,跟FileReader读到的长度,不一样
- 怎么解决IPA processing failed错误, 用xcode 11打包
- 在电脑上怎么做报表新手_电脑excel表格数据图-初学者在电脑上如何制作电子表格...
- WPF编程宝典--控件
- python列转行函数_python 列转行
- 资料员培训建筑八大员培训建筑工程施工资料管理中存在的问题
- 五年之后的前端会是什么样?
- 华为mate50pro和华为mate50RS的区别
- 扬笛水墨人物画——《怒放4》作品赏析
- 计算机邀请函操作,Word计算机二级MS office常考内容——用邮件合并技术制作邀请函...