作者 | Just

毫无疑问,搜狗的大部分 AI 技术已嵌入到搜索和输入法这两大“拳头”产品 。

语音技术最大的一个落地产品当属搜狗输入法,它集成了搜狗的语音输入功能、语音翻译功能。而在搜索上,主打搜索直达功能背后的智能匹配技术可以让在用户提出问题后在首条就可直接给出最为匹配的答案,而不再单纯给出多种结果。

除了在双引擎上落地 AI 技术,他们现在发力 B 端政企领域,打造相应的 AI 解决方案,比如他们已为一些行业提供了定制的输入法以及智能客服产品。

当然,与其他诸多互联网巨头一样,搜狗也开始发力 AI 硬件。比如搜狗的翻译机,其中结合了语音识别功能、拍照翻译功能。翻译机只是个开始,搜狗 AI 事业部总经理张博告诉 AI科技大本营,搜狗接下来会推出几款不同的智能硬件,这些智能硬件都是搜狗 AI 技术的大集成、大载体,并且也会着力在 AI 硬件上做一些拓展,争取让硬件成为搜狗接下来收入的一个重要来源。

9 月初,在浪潮集团承办的 2018 人工智能计算大会(AICC )上,张博接受了 AI科技大本营的采访,讲述了搜狗在翻译机等 AI 硬件上的技术、产品认知和发展战略,以下为对话内容:

翻译机是做 AI 硬件的起点

:无论是翻译机还是会务翻译系统的离线翻译效果都不太好,与在线翻译相比存在着一些技术挑战主要是有哪些?

张博:离线翻译确实不好做,它在没有网络的情况下,不能调用云端的 API 推理接口,只能在终端实现所有计算。

我们知道,翻译机使用的其实是跟手机类似的 SoC 芯片,而在手机端上要实现一套完整的语音识别、语音合成、机器翻译和 OCR 这套流程,计算量是非常大的,这种情况下效果一定是比在线要差,因为数据、算法都会有一些裁减,包括本身的算力也会低一些。

有了专用 AI 芯片后,离线的翻译技术是不是更好?其实不是这样的,目前国内外主流的 AI 芯片公司第一步做的是与图像相关的 AI 加速,但没有去做跟语音和 NLP 相关的加速。语音这块其实是有一些坑的,比如所有 AI 芯片厂商目前都久攻不下 CNN。

那离线情况下怎样实现更好的结果?比如一代搜狗翻译机的手段是专注于旅行这个场景,其实就是我们把数据裁减成(与旅行相关的)数据集,就可以得到比较好的结果。

接下来其实就是拼算法能力,相当于在更小的空间复杂度和时间复杂度里去做更好的效果,这就看算法工程师的能力了,我们也可以做产学研的道路,跟学校做联合研发和攻关把这件事做好。

提问:现在翻译机的企业都强调说自己的神经网络翻译技术多么好,支持的语音翻译种类是最多、准确率最好。但这套说辞太泛了,关于具体实现条件和使用环境都好像没有一个比较统一的标准?

张博:这个问题问的很专业。目前大部分人工智能技术都没有一个标准的评测规范和手段,可能像人脸检测这种安防领域公安部做了一些标准,比如在一个什么样的条件下,输入多少张图片,这些图片中有多少男、女,多少戴眼镜。但以语音技术为核心的领域,目前国内没有什么权威的评测的机构。这个问题正在得到一步一步解决,中国人工智能产业发展联盟也在推动这种标准的建立,标准的建立有利于整个行业发展。

:现在翻译机功能有离线翻译还有拍照翻译,甚至嵌入了语音助手等功能,对这款硬件产品来说,以后的发展走向是更多功能集于一身,还是说根据细分应用场景做出适当的硬件产品?

张博:这跟整个社会、整个用户的使用习惯有关系,我们知道移动互联网之所以能打败 PC 互联网,跟智能手机的普及有很大关系。在智能手机普及之前,大家也没有意识到手机竟然成了我们人生最关键的一部分。现在其实就已经有这样的争论,我们已经有手机了,为什么还要再去做一个翻译机。有翻译机了为什么还要加语音交互,你就会发现越做越大,越做越乱。

退一步想,如果拿一个翻译硬件来解决所有交互方式是不是最合理的?我觉得不一定,所以搜狗也在致力于解决这个问题,接下来会推出一系列新的爆款的智能硬件,很有可能就能解决交互的方便性,以及解决到底是再来一个翻译机还是再来一个手机的问题,结果就是可能不同的场景有不同的硬件。

提问:一代翻译机和翻译笔销量大概是多少?有道翻译蛋说卖了 10 万个。

张博:差不多也是这个数量,因为这个市场其实目前处于一个早期市场,大家的宣传还没有完全打开。

比智能音箱体验要好的智能硬件?

提问:刚刚您提到我们会做其他一些智能硬件,为什么在其他互联网企业推出智能音箱后搜狗到现在都没入坑

张博:搜狗在某些方面有特立独行的点,我们既然要发展智能硬件,肯定会做一些比智能音箱体验还要好的产品,因为智能音箱从根源上来讲毕竟还是跟风因素更多一些,大家可能看那个智能音箱很火,目前国内不说几十家也有上百家智能音箱产品了。但现在智能音箱的发展情况大家看起来不是那么乐观,太乱了。

提问:我们认为的不乐观具体指的是什么

张博:主要是这个产品感觉上用起来其实不一定那么自然、那么爽,它的使用场景有局限。因为毕竟这里面涉及到远场交互、方言这些东西并不一定能得到很好的解决,包括个人隐私也都存在一些问题。

提问:可以介绍一下新的智能硬件?

张博:这个不方便透露,但肯定是跟搜狗核心语音相关,其次它会大幅提升交互的方便性和自然性,翻译机提升的不够大,还可以更大。

提问:大概什么时候会发布?

张博:不超过半年时间。

搜狗AI事业部张博:不只翻译机,半年内将推数款智能硬件产品相关推荐

  1. 不只翻译机,搜狗将在半年内推数款智能硬件产品

    10月24日已是昨日,但属于开发者的1024一直都在--2018 AI开发者大会就是你的1024.11月8-9日,现场聆听国内外AI大牛的深知灼见,与工业界AI应用思维紧密同步,收获60+技术大咖的干 ...

  2. 一周AI要闻 | 微软成市值第一 亚马逊推首款云AI芯片 阿里组织架构升级

    关注网易智能,聚焦AI大事件,读懂下一个大时代! 各位看官,周末愉快,智能菌为您梳理本周AI要闻. 01 公司新闻 [雷军:未来智能音箱可能成小众产品 小米AIoT这样来布局]11月28日-29日,2 ...

  3. 科技新品 | 戴森限量版红金吹风机;环旭电子安卓系统移动型POS机;格之格首款智能便携式标签机...

    "科技新产品动态"栏目把新鲜的具有代表性的科学产品带到您眼前,涉及消费电子,半导体.服务器.智能家电等众多品类,提供图片和简单的文字介绍. 戴森推出限量版红金Supersonic吹 ...

  4. 翻译机之后,搜狗再推智能硬件产品录音笔

    去年 10 月,搜狗 AI 事业部总经理张博告诉 AI科技大本营(ID:rgznai100),翻译机只是搜狗做智能硬件的开始,接下里半年里,他们还将发布数款集成了搜狗 AI 技术的硬件产品. 3 月 ...

  5. 墨迹天气语音包_小米有品“智能AI翻译机”评测,还内置了语音助手,随身WiFi功能...

    出国旅游时,我们需要面对的最大问题应该就是言语沟通了,毕竟想要掌握一门新的语言不是什么容易的事情.近期,小米科技旗下的小米有品平台上线了一款新品:Langogo智能AI翻译机,对于想出国游玩或工作的朋 ...

  6. 小米翻译机闪亮登场,它称得上是便携式“翻译官”吗?

    提到小米,大多数人第一想到的就是火遍全球的小米手机.其实小米不仅专注于高端智能手机研究,还顺应用户需求研发了数款智能电子产品.如小米电视.小米翻译机.小米电动车.小米电饭煲等等!其中2019年底上线的 ...

  7. 当科大讯飞还在博鳌上刷存在感,搜狗已经准备好引领AI翻译机的下一波浪潮

    最近几年的国际会议,逐渐成为了智能硬件刷存在感的地方.大量跨语种沟通的需求.复杂繁多的信息展示交互再加上媒体的集中关注,让很多主打AI同声传译.AI翻译机.服务机器人等等产品的科技厂商费尽心机也要在在 ...

  8. 当科大讯飞还在博鳌上刷存在感,搜狗已经准备好引领AI翻译机的下一波浪潮...

    最近几年的国际会议,逐渐成为了智能硬件刷存在感的地方.大量跨语种沟通的需求.复杂繁多的信息展示交互再加上媒体的集中关注,让很多主打AI同声传译.AI翻译机.服务机器人等等产品的科技厂商费尽心机也要在在 ...

  9. 搜狗发布智能翻译机,看上去小众实际上野心很大?

    这几天注意到,搜狗在合作伙伴大会上,发布了两款翻译类智能硬件:"搜狗旅行翻译宝"和"搜狗速记翻译笔",两款产品搭配双麦克风阵列降噪,支持英日韩俄德等17种语言与 ...

最新文章

  1. android Button源码分析
  2. vagrant网站中box下载方法
  3. 程序员如何处理被 “吃” 掉的异常?
  4. java中的 关键词vali_Java中的关键字volatile详解
  5. csdn插件下载和应用
  6. 蒸汽管道图纸符号_管道设备表常用符号.ppt
  7. “什么?中东的土豪给我们 App 充了大钱!”
  8. Python 之 PyCharm + selenium 163邮箱登录详解
  9. bzoj2037 Sue的小球(区间dp,考虑到对未来的贡献)
  10. 鲲鹏芯片的服务器,鲲鹏处理器及服务器介绍.pdf
  11. MPLAB IDE V8.8进行程序烧写
  12. JS实现最美的3D宇宙效果
  13. Linux虚拟机增加sda容量
  14. Python判断时间
  15. python——pygame制作恶搞舍友小游戏
  16. 引入echars5.0报错“export ‘default‘ (imported as ‘echarts‘) was not found in ‘echarts‘
  17. 我们用程序整理出了一份Python英语高频词汇表,拿走不谢!
  18. Redis 常用运维命令
  19. 拿来即用——报表画图(饼图,速率图,表格图,柱状图)
  20. 人工神经网络概念及组成,人工神经网络基本结构

热门文章

  1. WooCommerce API Keys的生成和保存机制
  2. 51单片机简单乐曲演奏(青花瓷)
  3. 浏览器跳不同 不同页面 php,利用js根据不同浏览器自动跳转不同页面
  4. Map与JSON之间转换
  5. 什么是单例模式以及单例模式的几种实现
  6. VS2010:error C3083: 'Windows': the symbol to the left of a '::' must be a type
  7. 高性能永磁交流伺服电机系统控制策略
  8. 6-4 计算圆柱体的表面积(函数名隐藏)
  9. xcode6 关于iphone6、iphone6plus适配(一)
  10. 微信小程序实现页面强制刷新