锤子M1手机发布会结束之后,M1系列手机能否在诸多强敌面前成功突围眼下还不明朗,然而,多次被老罗推介的输入法,讯飞输入法却意外地火了起来却是事实。

在发布会之后的几天,这款输入法甚至成功登顶了AppStore 免费榜,老罗可能不是一个好的产品经理,但是,老罗一定是一个好的销售。看上去,讯飞输入法团队过去几年折腾的效果,还不如老罗三小时发布会上的卖力推介。要知道,这款输入法最早的版本可追溯到2010年10月。

在这场发布会之后,我以及朋友圈中的不少朋友,都下载了讯飞输入法,体验之后大家的答案是类似的:wow,惊艳、震惊、激动。大家之前没有想到语音输入法的识别率可以做到今天这样的程度,在噪音环境比如大马路上,哪怕你的普通话不是很标准,它依然可以准确地识别。

它还支持粤语、四川话、东北话、河南话、河北话、闽南话、客家话、贵州话、云南话、湖南话、山东话、山西话、陕西话、江西话、上海话、天津话、南京话、武汉话、合肥话等方言。甚至还可直接将你的语音实时地转化为日语、韩语、英语,或者反过来,这在我们出去旅游时与歪果仁交流会很方便。

更让人惊喜的是,它可识别一大段一大段的语音,并且自动断句,加上标点。这一点还不够理想,有时候断句会出错,还有总爱加感叹号。

整体而言,讯飞输入法已完全具备实用性了。

这段时间我一直都在用讯飞语音输入法,尤其是在走路的时候,在边吃饭边玩手机的时候,在躺着不愿意打字的时候。如果我不告诉聊天对象,对方不大可能察觉出来我是用语音而不是用键盘敲的字,简而言之:这款输入法的智能程度,已经顺利通过了图灵测试。

语音输入不是第一次“火”。

2011年,iPhone 4s面世,这是乔布斯的遗作,虽然是由库克发布,但这款手机从最初构想到最后设计均是乔布斯在主导,它最大的亮点就是引入了语音助手Siri。在这之后,Google Now被加入Android,国内也掀起了一阵子“中国Siri”潮,科大讯飞是玩家之一,除此之外还有小智360、虫洞,以及搜狗、百度等玩家,科大讯飞的投资者中国移动也凑热闹找讯飞定制了“灵犀语音助手”。

记得2012年前后,我安装了不少语音助手,还有输入法,并且在室内将它们进行对比,虽然略有差异,但都让人十分失望——识别效果太差,尤其是在我普通话不够标准的情况下。

2013年我有幸受科大讯飞邀请去他们位于合肥的总部进行了参观,在他们的体验厅我感受到了科大讯飞在语音领域的扎根之深,那时候科大讯飞还是两条腿走路,一边是做教育等行业解决方案,主要收入来自于B端,一边已开始布局输入法等C端产品,具体可看当时的文章《科大讯飞,站在十字路口》。

2014年再次去科大讯飞时,发现他们已在重点关注物联网、智能硬件等新型设备——这些设备看上去比手机更适合语音输入,比如给电视换台、让汽车开窗。不过,直到老罗在M1发布会上介绍讯飞输入法的效果之前,我都没有想到语音输入法能做到这个程度。

为什么这么好的产品,现在才火?

从技术层面来看,这几年基于深度学习的人工智能技术,给语音识别带来了全新的技术突破。

语音技术之前是基于规则,识别率做到90%要再提高一个百分点就非常困难。然而有了深度学习技术,基于机器学习对海量语音进行大量统计再不断改进算法,让语音识别乃至语义理解有了质变,准确率、抗噪力以及口音容错性大幅提升。且支持更多方言,和翻译变得更加容易——基础模型不变,只需面向不同语言进行对应领域的算法优化即可。

在2012年开始投入语音技术研发的百度就采取了基于深度学习的语音算法,Deep-Speech,百度首席科学家吴恩达曾对外媒表示这个技术在噪音环境下的识别能力比Google、微软等公司的要好。今年年初,百度的深度语音技术被《麻省理工科技评论》评为“十大突破性技术”。当然,搜狗、以及讯飞的语音技术,同样是基于深度学习技术。百度有百度大脑,讯飞则有讯飞超脑。

还有,语音交互的“引爆点”、人工智能的“引爆点”到来了。

每一项改变世界的应用背后,都是大量新型技术的交叉综合应用,汽车涉及到机械、材料、能源等等,计算机涉及到芯片、存储、硅材料、网络、人机交互诸多技术,语音交互的普及则涉及到网络、算法、数据、服务诸多方面,只要其中一项是短板,这个应用就不可能普及。如果这个短板被克服,这个应用就会被某些随机元素引爆。

现在,语音输入的算法(深度学习)、网络(4G)、数据(云计算)瓶颈均已被消除。罗永浩起到的作用是引爆讯飞输入法,这个App蹿红的背后是讯飞输入法们的多年努力,涉及到技术、产品诸多方面,4G网络的普及也功不可没:离线语音识别效果很差,在线则要有4G或WIFI网络才具可用性。

Gartner 在2012年曾做过一个总结,一个完整的技术成熟周期包括:

1、技术萌芽期(technology trigger)

2、期望膨胀期(Peak of Inflated Expectations)

3、泡沫化的谷底期 (Through of Disillusionment)

4、稳步爬升的光明期 (Slope of Enlightement)

5、实质生产的高峰期 (Plateau of Productivity)

在那份报告中,其预测语音会在2-5年走向成熟。

现在看来,Gartner的预测是正确的。

面向语音的研究可以追溯到上个世界五十年代,1952年贝尔研究所Davis等人研究成功了世界上第一个能识别10个英文数字发音的实验系统。在此后的几十年间进展缓慢,技术水平、计算能力和应用场景,都不成熟。由于场景的局限性,语音技术在PC互联网时代并未大幅普及。主要应用在一些垂直领域例如呼叫中心、教育、电信和金融等行业,这段漫长的历史应该是第1阶段。

Siri面世之后,语音产业先后经历2、3阶段。今天,语音已到第4阶段、接近第5阶段了。随着Amazon Echo、Google Home、百度度秘、Siri以及讯飞输入法的普及,通过语音与机器交互很快就会成为主流。

当然,我们与机器的交互方式从来不是单一的。今天苹果在Siri、触摸屏上发力的同时还在努力打造一个更好的利用手指交互的键盘:TouchBar。未来必然也是,不同的交互方式,适合不同的设备,不同的场景,甚至一个设备都需要多种交互,我们的手指、指纹、声音、虹膜,能用到的都会用上。当然,一个大的方向是,我们与机器的交互将越来越自然,越来越简单,越来越高效,正如马云所言:未来机器不再是我们的工具,而是我们的伙伴。

讯飞输入法今天才火起来,还有一个重要的原因,就是讯飞的低调。这家总部位于二线城市合肥的科技公司,缺少了一些互联网范儿,正如其创始人刘庆峰在2013年所言:

从讯飞的移动互联网的战略中,我们也在不断的反思,我们跟那些小的互联网厂商比,或者跟更大的互联网厂商比,都显得我们的效益比他们高,真的不是我们做事速度没他们快,而是没他们那么会宣传,没他们会运作,当然在这个产品的迭代和推动中我们也还有很多要改善的地方。

所以尽管讯飞输入法已经坐拥3亿用户,在行业里面却没有形成很大的影响力,互联网圈许多人都不知道,说到语音依然可能会联想到Siri、百度甚至搜狗,而不是讯飞。不知道接下来,这家公司会不会有所改变?

为什么很牛的讯飞输入法今天才火,还得靠罗永浩?相关推荐

  1. 移动端点击拉起输入_没广告、无捆绑、真清流!讯飞输入法PC版评测:跨屏语音动口不动手...

    原标题:没广告.无捆绑.真清流!讯飞输入法PC版评测:跨屏语音动口不动手 一.前言:等待五年 讯飞输入法PC版终于回来了 大家所熟知的讯飞输入法,最早是在Android和iOS等移动端起家,并凭借强大 ...

  2. 讯飞输入法PC版测评:拼音输入糟糕,语音输入强悍

    其实我手机用的就是讯飞输入法,它的语音输入和手写输入确实很爽. 最近有朋友在我的文章后面留言说,讯飞也有电脑版,于是去了讯飞主页下载安装试用了一回. 在太平洋下载站,关于讯飞输入法PC版的介绍是这样的 ...

  3. 讯飞输入法10周年:日语音交互次数超10亿

    2020年10月20日,"讯飞输入法10周年A.I.输入沙龙"在北京中粮·置地广场举办,主题为"语见更好的我们".科大讯飞副总裁章继东.科大讯飞消费者BG副总裁 ...

  4. 科大讯飞:讯飞输入法日语音交互次数超10亿,将发力5G和AIoT领域

    蓝鲸TMT频道10月20日,讯飞输入法在10周年沙龙活动中发布了10.0版本,据介绍,该版本搭载了"动态自适应编解码语音识别引擎",新增的唇形辅助输入,能够提高嘈杂环境及近距离多人 ...

  5. 讯飞输入法皮肤制作_手机输入法哪家强:百度、搜狗、讯飞输入法对比评测

    最近用红米K20 Pro,感觉十分流畅,不愧是旗舰机型.而且,其输入法都装了三个,显得比别人更全面. 其预装的是百度输入法小米版.搜狗输入法小米版,以及讯飞输入法小米版.呵呵,装了这么多,到底哪个好呢 ...

  6. 讯飞linux_深度deepin又添一员“猛将”,讯飞输入法Linux版来了

    现在已经有不少的用户在使用深度Deepin操作系统了,很多用户已经把deepin操作系统当成了自己的生产力工具,最近有粉丝留言问:Deepin操作系统有没有好用的输入法推荐吗?昨天没有办法告诉你,今天 ...

  7. 2019输入序列号闪退_正式告别60秒长语音 讯飞输入法新版评测:能动口我绝不动手...

    一.前言:60秒长语音有希望消灭了 从2010年,讯飞推出业界首个中文语音输入法,将语音输入带到大众面前直到今天,语音输入早就不再是当初功能机时代"语音王"的土味儿模样.如今,语音 ...

  8. 讯飞输入法pad版x86_观察:不惧腾讯、阿里,科大讯飞推出在线文档App“讯飞文档”...

    互联网大佬为旗下产品站台并不罕见,但马化腾对腾讯文档的点赞,让腾讯文档这个名不见经传的产品迅速爆红.不到2年时间,腾讯文档月活跃用户突破1.6亿,用户累计创建超5亿份文档. 据郭静的互联网圈观察,8月 ...

  9. android 表情退格,讯飞输入法Android V8.1.8212 嘘-别说话全套emoji表情上

    emoji表情大家都不陌生,一个个"小黄脸"在手机聊天场景中高频出现.随着蹿红网络,emoji表情甚至跑进大电影中成为主角.为何大家如此喜欢它?因此各式表情很像不同心情的自己,开心 ...

最新文章

  1. windows c 操作mysql_windows下c/C++操作Mysql的一些总结(绝对精华,不要错过)
  2. [HDOJ4588]Count The Carries(数学,规律)
  3. 计算机怎样连接网络适配器,win10 本地连接共享internet时, 会将承载网络适配器IP设置成192.168.137.1但不成功...
  4. skywalking 安装_SkyWalking全链路追踪利器
  5. Matplotlib 中文用户指南 4.5 标注
  6. 在mingw编译环境下为dll添加版本信息
  7. 计算机网络学习笔记(17. 计算机网络作业一)
  8. c++——对象的构造和析构函数、构造函数的分类及调用
  9. [论文阅读] Looking for the Detail and Context Devils: High-Resolution Salient Object Detection
  10. 对于数组使用sizeof(a)和使用sizeof(a[0])
  11. C++ Primer Plus学习(二)—— 基本编程技能
  12. 通配符星号(*)和问号(?)的区别
  13. springboot中redis的工具类及配置类
  14. MATLAB 点运算与除法
  15. 蓝箭航天自主研发80吨液氧甲烷发动机喷管下线
  16. 微信公众号使用:给微信公众号自定义菜单中设置查看历史记录的功能
  17. 厦门在职研究生计算机专业,2019年厦门大学在职研究生有什么专业可以选择
  18. 全国计算机专业大学排名全部,全国计算机专业大学排名汇总
  19. jQuery-表单校验
  20. nividia-smi命令不显示占用显卡的进程

热门文章

  1. webdriver 设置代理
  2. C++复习之路23:计算机网络相关3:
  3. 用 python 实现拳皇对战游戏,让你成为女神心中的拳皇
  4. 如何在网页上显示腾讯QQMSN旺旺在线洽谈
  5. Monaco Editor 使用入门
  6. 《CPU自制入门》笔记——第二章 电路板的设计与制作
  7. WOJ1018-King Kong
  8. 【数学建模-某肿瘤疾病诊疗的经济学分析】数据分析
  9. 基于HTML+CSS+JavaScript制作美食文化网站 ——卡通创意的烧烤(5个页面) html静态网页设计制作 dw静态网页成品模板素材网页 web前端网页设计与制作 div静态网页设计...
  10. 烁博科技|浅谈视频安全监控行业发展