在阿西莫夫的代表作《基地》中,除了先知谢顿贯穿全线,其他主角都是门徒。他们内在为直觉所驱动,外在被时代所推动。他们在历史上的出场毫无征兆,却在潮流中游刃有余。你会惊叹,为什么是他?

离开谷歌、微软、IBM、Facebook、阿里、百度,告别自己过去的所有荣耀,重新走上创业之路,崇尚技术的护城河。为什么是他?新华网开辟“出走的门徒”系列,讲述这样一群科技界理想主义者的现实路径。

新华社上海2月4日电(记者周琳)2004年黄伟从中国科技大学毕业时,正好赶上第二次人工智能浪潮临近破灭的尾巴,却同时又是语音识别行业第一个风口到来不久的时候。2005年,全球领先的语音识别公司Nuance上市,市值最高突破90亿美元。3年后,黄伟所在公司的语音识别部门被Nuance收购。

这个本是实现计算机听觉为强人工智能服务的领域,却在AI趋冷的时候大热,更说明了技术的不可预见性。

近15年过去,这种戏剧化的变化再一次出现。尽管出现了AlphaGo横扫围棋界等标志性事件,让AI这一行业在2016年开始红得发紫,尽管2016年老罗在发布会上show了一把计算机听觉的精准性,亚马逊的语音助手Echo Alexa销量狂飙了三倍,我们却已经很难得出,语音识别已经站在了AI创业风口浪尖这个结论。

当年和黄伟一起学习或共事的人,很多人都离开了这一行业。固守判断、等待爆发是一件很考虑耐心和实力的事情。

谁也不知道下一个风口会什么时候流行;技术也并非是唯一的护城河;但是,语音识别正确率的不断提高,解放人类双手是大势所趋。这恐怕是黄伟在经历过摩托罗拉、Nuance、盛大、创办云知声之后,能最坚定的信念。

    逆风反击:AI领域“模仿者必死”

云知声于2012年成立,也是在那一年,Siri开始支持中文。

语音识别领域的厮杀在这些年显得非常激烈。国外,谷歌、亚马逊、微软都通过技术积累和收购初创公司,杀入战局;国内,百度凭借着在AI领域的提前布局独自拼夺,和黄伟师出同门的科大讯飞更是成立十多年,属于行业当之无愧的老大。

2012年前后,正处在AI第三次兴起的交替期。那时候,科大讯飞还没有成为网红、AlphaGo还没有惊艳亮相,市场对人工智能最火热的讨论仍然来自于科幻电影。

后发却想要先至,信心是最重要的催化剂。在那时,极少有创业公司敢把所有身家赌在“深度学习”这件事情上。

云知声做的第一件事,就是把深度学习应用到了语音识别里,而且把它开放出来提供给了第三方。

2012年9月,云知声发布了基于传统统计模型的第一代引擎,准确率上升到了85%,比当时的讯飞高出5个百分点。但想要再优化,就必须要有迅速获得大量、免费的数据。于是,云知声开放了自己的平台,任何人、任何组织只要在平台上注册,就可以免费使用公司的SDK(软件开发工具包);在APP里接入这一SDK,就可以免费调用云知声的语音服务。

凭借着免费这一法宝,到2013年底平台上接入的企业客户数量达到接近一万家。现在,企业客户数达到了3万家。快速的数据积累,让云知声进行了一系列数据迭代和算法优化,将识别的准确率提升到了97%。

但再好的技术,只有当它变成对用户有价值的产品时,它才有商业价值。既便技术过硬,留给后来者的机会仍已不多了。

第二步到底应该怎么走?做APP?流量的导入掌握在BAT手里,你不可能再用那么低的价格去实现基础设施(用户)的积累;做与科大讯飞雷同的业务?也很难从成熟的大公司手中去抢蛋糕吃,更何况在教育等领域,讯飞的优势地位几乎是无法撼动的。

“有行业第一,并不可怕。”黄伟意识到,任何一个公司,有它的沉淀,就有它的包袱。大公司受制于股权等因素,对很多新领域很难快速反映。必须找出一条和行业老大不一样的路,而且向投资人证明这条路在商业上是可行的。

2012年底的很多科技新闻中都曾展望:苹果会开发一种语音的方法解锁pad,而非现有的按键。最后我们发现这一功能在家电上更早出现。“我们根据用户场景倒推,未来用户的形态应该是,比如,在客厅的沙发上,自然与空调对话,而不需要凑上去和它交流。”黄伟说。

随后,在乐视TV上、美的空调、抽油烟机上,语音助手迅速落地。回过头去看,其实只用了2年的时间,云知声就将自己的基础语音识别引擎落地并步入正轨,再用数据反哺算法,不断将其客户从家电拓展到医疗、汽车等其他领域。

对于黄伟而言,产品想要复制到任何需要文字录入的行业,司法、传媒等,就没有太多不确定性了。“我们最后证明了:一,BAT之下确实还有别的路。二,行业老大之外这条路确实是可行的。”黄伟说。

 顺风快行:手机不会是语音识别“主战场”

2014年,黄伟第一次提出了自己的“云端芯”概念,将公司定位于“一个IoT(物联网)时代的语音AI服务商”。为了做物联网,云知声在2014年引入高通成为战略投资方;同时进行内部架构的调整,成立了IoT事业部,占当时总人数的一半以上。在2016年AlphaGo还未火起来的2月,云知声又成立了AI Lab。

黄伟介绍,公司云端芯的服务分三种:1)有芯片级技术,比如说冷唤醒和打断等;2)有终端软件的交互层面,比如开车时万一网络不好,我们还有纯离线的方案;3)还有一些复杂的请求走云端。最后的解决方案是考虑了有网络、无网络等所有环境,并不是只卖一个芯片或者云端 SDK 。

有了这样的安排,芯片不仅可以收集信息,还可以承担一部分智能的功能,解决基本的需求。

这看起来并不是技术的颠覆。然而对于一个创业公司而言,如何确定你的商业模式和产品模式,如何建造你自己的壁垒,恐怕是技术之外更重要的考量。

对于这些模式的确立,黄伟的思考模式值得探究。传统而言,大家的思维模式是“做什么”;而笔者接触过的人中,有两个人并不是这样。一个是喜马拉雅的余建军,他的说法是“踩过了所有的坑才成功了”;另一个就是黄伟,他给人的感觉是“先考虑什么坚决不能做”。这种归纳和排除的出发点,和旁人不同。

2012年-2014年,黄伟坚持的是“不做APP”。到了2014年确立了“云端芯”战略,他又有两个排除:不能只做联网方案、不能只做手机方案。

很早黄伟就认为,手机从来就不是语音识别的主战场。你肯对着音箱、冰箱、马桶、抽油烟机说话,即便这些用品没有屏幕。但手机还是基于屏幕的,它更常用到的交互方式是“触碰”而非声音。

市面上很多在做智能家居的公司还是基于APP和手机的,例如将家电联网,在用手机来控制操作。而横扫欧美、被称为亚马逊“翻身之作”的Echo Alexa则是一个用音箱来连接的中控平台。

“智能家居人机交互的正确做法恐怕最后不会是APP。”黄伟说,它可能会是一个全新的增强设备,甚至最终取代手机。不过与亚马逊从中控开始做的方法不同,云知声还是希望先从终端渗透率不断增加着手,培育用户的习惯。

作为语音助手,Alexa看起来似乎是所有语音识别公司的竞争对手。黄伟则认为并不是。

“亚马逊肯定不是我们的竞争对手,合作机会是大于竞争的。”黄伟说,从智能层面,国外的云服务商在国内落地是很难的,而在亚马逊本土化的落地方案等方面,都是有合作机会的;在云端服务上,很多技术都可以由云知声来提供。

一个成功的企业,始于技术,兴于商业,却久于管理。“当时间到了2016年时,AI公司还在讲算法、讲评测,只会非常不成熟”。黄伟说,没有纯粹的AI公司。只有技术和行业结合,将技术、数据和商业闭环打通的公司,才是一个健康的公司。在人脸识别、云服务等任何一个细分领域,最后都只会有少数几家公司能胜出。

  摆脱风口:技术并非唯一护城河

在《乌镇指数:全球人工智能发展报告(2016)》中,云知声以6000多万美元的融资规模,排名在全球AI企业融资额榜单第19、中国第三(另外两家分别是碳云智能和出门问问)。

但即便融资了这么多钱,此时你如果打开云知声的官方网站,却依然很难体会出“艺术感”。文字放得很大,有的时候一个屏幕上只剩下了导航栏和标题图;首页可以拖动很长,画了很多展示技术的概念图,每张图片连箭头都需要横平竖直。

这大概已经是理工男对艺术最佳的理解。

黄伟所毕业的中国科技大学,是国内知名的理工类学校,其最盛产的有三类人:理工男、穿着大裤衩的理工男以及穿着大裤衩、趿着黄拖鞋的理工男。在那里,谈恋爱略等于一起上自习;很厉害略等于可以一学期刷光全套吉米多维奇;优秀毕业论文略等于一篇Nature或Science。

然而,对技术的极致崇拜,有时候在商业上并不见得是优势。在这个故事满天飞的时代,你的巷子深了,资本还没走到,就会醉倒在半路。曾经在一个科大创业类的群中,“技术和Pr哪个更重要”的话题,几乎百分百都把票投给了前者。

时间回到2006年。彼时还在摩托罗拉语音识别部门的黄伟,为MOTO最具盛名的“明”系列手机开山之作A1200提供语音技术支持。如今你在百度中搜A1200,还有很多人人网的评测说,“教你怎么语音打电话”。

在当时识别准确率还不高的情况下,愿意去做这样尝试的人,简直是在刀尖上舞蹈,这得对自己的技术多有信心。

作为纯正的理工男,黄伟也曾有过“将技术作为唯一评价标准”的时代,但创业数年,他正在不断修正自己的判断。这种管理上的改变和平衡,并非是大学教他的,而是在盛大研究院管理期间体悟出来的。

从摩托罗拉语音识别部门被Nuance收编,到不愿意只做本土化,前往盛大创办研究院,再到自己创业,黄伟每一段经历,似乎都在刻意补齐了技能树上的短板:在摩托罗拉,潜心做了几年的研发和算法;在盛大,升级了自己管理的技能树。

“不是说技术不重要,但如果别人技术98分、我96分,这2份的差距不足以决定商业上的生死;而如果其他方面别人做的很好,做到了80分,你只做到了60分,你必死啊。”黄伟说。

最后创业时,你的资源永远是有限的,不可能每个岗位都招到最合适的人。能够把不同价值观、不同追求的人,集合在一起,将技术和管理结合,最后平衡、平衡、平衡,最重要的事情说三遍。

黄伟认为,技术在一个公司最终的比重只占到20%。尤其在中国这个市场环境中,光有技术是不够的,要补足很多其他的能力。单一人群创造力是有限的。无论是技术很牛的人,或者没有好的教育背景,但对产品特别有感觉的人,都特别值得学习。

“过去我们在人工智能领域耕耘,缺少经费和机会。于当时,我们是不幸。而今天人工智能成为科技领域的新热点,对于在人工智能领域坚守多年的我们来说,我们又是如此幸运。”黄伟说。(完)

转载于:https://my.oschina.net/ZZKAJ23/blog/885248

出走的门徒之五—云知声 黄伟:AI热终会冷,要跑的比任何风口快相关推荐

  1. 专访云知声黄伟:场景定义芯片,未来所有场景都需要AI | AI名人堂

    栏目简介:激荡六十年,人工智能已经起航.然而在未来面前,我们都还是孩子.究竟是"奇点临近"?还是泡沫行将破灭?为了解惑,<AI名人堂>将汇聚领航者智慧,和你一起探索前行 ...

  2. 云知声黄伟、地平线余凯、清微智能尹首一……技术与投资、产品与市场、机遇与心态,关于芯片不得不说的话题...

    从左至右依次为:黄伟.余凯.尹首一.曾浩燊.杨光 整理 | 王与桐 11月9日至11月10日,科技智库「甲子光年」在北京举行2019「甲子引力」大会.在9日下午"前沿科技"专场的主 ...

  3. 新获融资1亿,聚焦全栈,云知声背后的AI下半场

    詹士 白交 发自 凹非寺 量子位 报道 | 公众号 QbitAI AI独角兽在进入上市关键期. 从智能芯片寒武纪.CV四小龙,再到自动驾驶地平线--各家经历技术到产业化变化后,又遇资本行业变化.行业祛 ...

  4. 云知声CEO黄伟:AI对产业的驱动不仅是创新更是颠覆

    4月13日,云知声CEO黄伟应邀出席猎云网2017人工智能产业创业创新峰会,并发表<人工智能如何促进产业化驱动>的主题演讲,结合云知声的产业落地成果,阐述了AI对产业驱动带来的颠覆式机会. ...

  5. “不设边界”的云知声:从多场景AI芯片到视觉AI,誓要2019营收近3倍

    记者| 杨丽  出品| AI科技大本营 若非要总结 2018.展望 2019 的话,可以借用云知声创始人兼 CEO 黄伟的一句点评:"所有伟大的公司都诞生于真实的生产需求." 20 ...

  6. 云知声联合亿咖通科技成立合资公司,布局汽车 AI 芯片

    5 月 16 日,在云知声全球首款面向物联网的 AI 芯片 UniOne 的发布会上,云知声宣布了与吉利集团战略投资.独立运营的科技生态企业--亿咖通科技(ECARX)的合作消息.经过三个月时间紧锣密 ...

  7. 云知声依托人工智能先发优势,率先入局ChatGPT

    自从ChatGPT诞生以来,市场上关于人工智能.云计算等相关的衍生依然持续当中,短期还未出现衰竭的迹象,并隐隐有加速冲顶的迹象.在此背景下,不少行业巨头都宣布加码ChatGPT,包括了谷歌.百度.阿里 ...

  8. 云知声AI开放平台之语音合成技术:让AI人工智能照亮智慧生活

    前不久,中央广播电视总台(CCTV)首个AI主播"AI王冠"通过一栏真人主播与AI主播首次同框互动的特别节目与大家正式见面,引发了社会各界的广泛关注.这名AI主播拥有十分自然的声音 ...

  9. 登陆成功率 99%,云知声携手平安好医生推声纹登录系统

    近日,云知声宣布与医疗健康生态平台平安好医生(01833.HK)共同研发的"声纹登录系统"(又称声纹锁)经过多次模型优化和升级迭代后,登录成功率接近 99%,达行业一流水准. 声纹 ...

最新文章

  1. 为了人类的未来,请赋予机器人智慧和情感!
  2. @Autowired原理
  3. android 新闻编辑,超机访问:ZOL手机新闻编辑背后的故事
  4. 2021牛客多校3 - Black and white(思维+最小生成树)
  5. mysql Access denied for user root@localhost错误解决方法总结
  6. 在Apache上调试Asp.net 1.1/2.0代码
  7. 驰骋工作流程引擎多人待办处理模式的升级
  8. Android中设置显示文本,TextView控件的使用(Android设置文本显示格式)
  9. 阿里云云计算 11 ECS初体验-- 动手实验
  10. Android 打开URL
  11. 选择合理的WCDMA网络无线扩容方案(转)
  12. Nodemcu 背篼酥课堂--物联网实战体系课程
  13. 一个测试经理/测试主管/测试总监的工作总结
  14. PXE配置中ks.cfg文件介绍
  15. 关于isEmpty(),null,“”的理解
  16. 1658. 合法标识符
  17. 图像处理之Bolb分析(一)
  18. 修车案例 | 2005 款奥迪 A6L 车发动机故障灯异常点亮、加速无力
  19. Html顶部导航栏实现
  20. 江苏大学计算机技术考研试卷,江苏大学考研历年真题汇总

热门文章

  1. Unity3D---精灵图片裁剪及简单UI搭建
  2. excel数据多列排序
  3. Android百度地图开发之指南针
  4. 零售价9000美元!索尼发布首款专业无人机;三星推出最小尺寸高像素图像传感器 | 美通社头条...
  5. excel取消密码_Excel的各种加密技巧,让你的数据更安全
  6. Python 进行HTTP代理 多线程实现微信刷投票开发
  7. 开怀大笑有助于使心中的郁闷情绪得到疏导
  8. 苹果承认iOS源代码泄露,对iOS 11.2.5的有没有影响
  9. 通用计算机s3,计算机中S1,S3,S4,S5各自的状态是什么?
  10. 文件底层I/O基本操作——东写西读南开北关中位移_莫韵乐的Linux英雄传