写在前面的话:

博客园是分享原创精品博文的地方,感觉自己的这篇博客至少是原创,也花了一些心思,自我感觉良好,呵呵,所以还是发布上来了,期望和大家一起交流。这个HiVoice是个人根据时下流行的语音识别技术加上自己的一点点小想法完成的,后面的扩展应用也期望和大家一起交流分享。

使用谷歌语音识别打造语音管家HiVoice

一、背景

随着苹果和谷歌等语音识别技术的推广,语音识别技术越来越受人关注。

二、SWOT分析

使用谷歌语音识别的SWOT分析如下:

S(强势,Strength):

1)WEB语音识别,只需要最新版谷歌浏览器就可体验语音识别服务;例如微软的SAPI语音接口,则必须要用户客户端安装SAPI SDK等;

2)良好的语音识别率;

3)集成方便,例如需要为您自己的网站集成谷歌语音识别服务,只需要添加一个语音识别标记即可。

W(劣势,Weakness):

1)浏览器要求,例如必须使用谷歌浏览器最新版浏览器。

2)必须联网。

O(机会,Opportunity):

1)用户体验需求,现在用户体验的需求越来越高,语音识别的需求越来越大;

2)您觉得还有其他哪些机会,欢迎交流。

T(威胁,Threat):

1)版权、授权;
2)只能依赖谷歌语音识别服务,如果谷歌服务器无法与国内进行良好的稳定连接,国内的服务就会受影响。

三、想法:语音管家HiVoice

开发一个常规的语音识别程序,可能需要安装很多语音包和框架组件,最主要的是识别率不太高,要做到好的识别率需要进行较长时间的语音识别训练和更多的细节处理,但是现在只需要添加一个语音识别标记,再编写语音识别结果的处理程序即可完成属于我们自己的语音识别控制程序 - 语音管家HiVoice。

语音管家HiVoice是什么?

语音管家HiVoice = 谷歌语音识别 + 语音识别控制、集成程序。

即利用谷歌语音识别完成语音识别功能,而语音管家则根据识别后的文本结果进行处理,例如使用一个switch程序判断来执行不同的事件响应,当然也可以有更复杂程序处理。

四、视频实践演示

目前语音管家HiVoice V1.0完成了,演示网站是http://www.100fks.com,必须使用谷歌浏览器,这是一个论坛程序,能通过语音进行常见的论坛操作。

请先看视频演示(高清请看附件):

视频地址:http://player.youku.com/player.php/sid/XMzgyODYzNjY0/v.swf

语音指令动作表

五、扩展应用

根据不同的应用场合,我们可以扩展出很多应用:

1)网页语音管家程序,例如只需要网站引用一个hivoice.js文件,即可允许用户进行网站的语音识别控制,例如语音控制浏览网站各个栏目和文章、发表文章和评论等;

2)电脑语音管家程序,编写一个客户端软件框架再结合谷歌语音识别,可以完成语音控制管理电脑的各种操作,例如打开音乐,打开网站,打开word,关闭等操作,同时可以拷贝到U盘/邮件/网盘等地方便于携带;

3)移动应用服务;

4)浏览器插件,开发火狐、谷歌等各种浏览器插件(例如谷歌插件Voice Search)。

六、免费定制

1)交流分享,欢迎大家一起交流和分享;

2)免费定制,如果您的网站也想集成语音识别服务,请联系我 ,申请表请参考下面的附件。

高清演示视频附件下载:请点击这儿下载

转载于:https://www.cnblogs.com/histudy/archive/2012/04/18/2454811.html

使用谷歌语音识别打造语音管家HiVoice相关推荐

  1. 在中国使用谷歌语音识别_如何在Google文档中使用语音输入

    在中国使用谷歌语音识别 Google Docs lets you use voice typing to dictate using your computer's microphone. It's ...

  2. 谷歌语音识别_谷歌 语音识别 语种 - 云+社区 - 腾讯云

    广告关闭 腾讯云双11爆品提前享,精选热门产品助力上云,云服务器首年88元起,买的越多返的越多,最高满返5000元! 提升语音识别的端到端模型在谷歌各式各样的语音搜索应用中,都是基于传统的自动语音识别 ...

  3. 谷歌语音识别功能Live Transcribe,让AI帮助语言障碍者“说话”

    原标题:谷歌语音识别功能Live Transcribe,让AI帮助语言障碍者"说话" 目前,全球有4.66亿人患有残疾性听力损失.而据世界卫生组织估计,到2050年,这一数字将超过 ...

  4. Android 调用谷歌语音识别

    調用谷歌语音识别其实很简单,直接利用 intent 跳转到手机里面的谷歌搜索 代码也很简单,直接调用方法 startVoiceRecognitionActivity() 如果大家手机里面没有谷歌搜索, ...

  5. Android 调用谷歌语音识别:获取识别结果,进行文字输出

    调用android 谷歌语音识别 ,获取识别结果,首先添加权限: <uses-permission android:name="android.permission.INTERNET& ...

  6. Android语音识别——谷歌语音识别与百度语音识别

    Android语音识别,简单的理解就是把语音转化为文字. 在日常中,语音识别,车载导航.语音输入等,虽然不一定准确,但用途广泛. 这里就介绍下谷歌原生的语音识别与百度的语音识别 谷歌语音识别 谷歌语音 ...

  7. google语音识别 android,Android 调用谷歌语音识别

    調用谷歌语音识别其实很简单,直接利用 intent 跳转到手机里面的谷歌搜索 代码也很简单,直接调用方法 startVoiceRecognitionActivity() 如果大家手机里面没有谷歌搜索, ...

  8. 语音交互程序:语音识别、语音输出、录音计算

    语音交互程序 预览 一.简介 二.构成说明 (一)语音识别与语音输出 (二)命令读取模块 三.功能说明 四.模块下载 五.示例完整版本 六.补充:实现交互等待即唤醒 (一)唤醒过程说明 (二)下载方式 ...

  9. java+语音识别+谷歌_JAVA使用谷歌语音识别API

    我正在尝试使用谷歌语音识别API.这是我写的代码: 有用.我从服务器得到答案: {"status":5,"id":"8803471b14a2310df ...

最新文章

  1. 学C++走游戏方向,是不是非常艰难自找苦吃?
  2. 丰农控股 CIO 王轶枭:万亿级农资市场,神策数据助力大丰收筑就数据驱动核心竞争力
  3. 解决执行 df -h 卡住,yum和rpm都无法安装软件问题
  4. android应用启动次数,应用统计: APP启动次数,软件用时统计,用量提醒
  5. linux 命令终端显示-bash-4.2#解决方法
  6. bash 历史记录_这些提示使Bash历史记录更加有用
  7. php 写一个大富翁游戏,抽奖系列:如何用纯js做一个大富翁游戏
  8. 利用管道实现进程间同步
  9. 梦里看到你为我写的情书
  10. Spark standalone 模式下的集群部署
  11. catkin_make:Project ‘cv_bridge‘ specifies ‘/usr/include/opencv‘ as an include dir, which is not fo
  12. notepad++下的字体设置
  13. maven简单了解,没有Maven和使用Maven的区别
  14. AI智能电话机器人源码搭建的原理
  15. 苹果电脑如何优化MAC系统内存?怎么清理系统垃圾?
  16. JavaScript 鼠标事件
  17. Yielding Processes
  18. 中职计算机专业优质课公开课,如何上中职计算机公开课.pdf
  19. supersqli(SQL注入流程及常用SQL语句)
  20. Flink 的 算子链 和 资源组

热门文章

  1. Kotlin入门(8)空值的判断与处理
  2. Android开发笔记(十四)圆弧进度动画CircleAnimation
  3. vue2.x-cnode(vue全家桶)
  4. spring 安全模块在jsp中误用引起的问题
  5. 那些年我们踩过的乱码坑
  6. About Undefined Behavior[译文]
  7. 在tomcat下context.xml中配置各种数据库连接池(转)
  8. 天河一号超级计算机研制成功,我国首台千万亿次超级计算机“天河一号”研制成功,其运..._简答题试题答案...
  9. Win-MASM64汇编语言-PTR运算符
  10. Kafka-consumer(消费者)