郭一璞 发自 大望路 
量子位 报道 | 公众号 QbitAI

Google把安卓做成了操作系统,让其他手机厂商也能用这样的系统,融入安卓的生态。

微软把Windows做成了操作系统,让各种PC厂商都能接入,融入Windows生态。

搜狗也要这样做了。

在手机和PC之外,搜狗瞄准了录音笔这个硬件行业,并正式将搜狗听写能力开放给业界,万城集团、索尼、爱国者、纽曼是第一批吃螃蟹的合作伙伴。

也就是说,日后如果你购买搜狗和这四家厂商中任意一家接入了搜狗听写能力的录音笔硬件产品,都可以使用同样的交互方式来使用它,并且都可以借助搜狗听写能力,实现语音转文字、同声传译、文本编辑能功能。

并且,对于这几家厂商来说,也不需要专门做适配,而是可以直接实现自动适配了。

这几乎等于一个操作系统了。

打通搜狗输入法,还能在线编辑

这个操作系统的具体功能,主要包括以下几项:

语音转写:语音转成文字,识别准确率95%。背后搜狗的语音识别技术访问量达到了每日6亿次。

搜狗输入法:接入搜狗输入法,以及背后的用户账号,用户在输入法中常用的个性化词库也可以用在语音识别里,常用的专业词汇、人名地名都可以被识别。

多端同步编辑:无论在PC、安卓还是iOS上,用户都可以同步录音和转写的文字,进行编辑。由于配备了声纹识别能力,转写的文字可以自动区分出说话人的角色,而不是直接呈现没有人物区分、不分段的一大片文字。另外,如果有转写不确定的部分,搜狗听写服务会提供多个可能的词汇备选,不用手动一个字一个字的人工删改。

云存储服务:用户的录音和转写都能保存在云端。

接入手机、PC端

除了录音笔之外,在移动端和PC端也可以使用搜狗听写服务。

手机端的搜狗录音助手App,就介入了转写同传能力,面向蓝牙协议开放。

而在PC端,即使是没有接入搜狗听写的的录音笔,如果连到电脑的USB接口上,用户也可以用PC端的搜狗输入法管理录音笔中的录音,提供转写服务。

而且,当连接到PC时,由于打开时使用的是你自己的搜狗输入法账号,像朋友的名字、行业词汇、喜欢的动漫主角这些特殊词汇都存储在自己的账号里,因此转录的时候,转录结果也会贴近你的词库。

举个例子说,如果你是《长安十二时辰》的粉丝,平常使用输入法有写过剧中的相关词汇,语音转文字的时候,AI系统就能够听出“伏火雷”;

如果你是是机器学习研究者,那么你一定经常使用输入法写相关的技术名词,语音转文字的时候,系统就可以分辨出“卷积神经网络”。

因此,即使是同一段录音,由不同人的账户来转写,得到的结果可能也是不同的。

另外,语音转文字的速度也有保证,一个小时的录音,大约要5分钟就能转写完。

开放服务,而非技术

在开放搜狗听写能力的发布会上,搜狗与万城集团、索尼、爱国者、纽曼成立了“AI创新联盟”。在搜狗CTO杨洪涛看来,录音笔这个产品,单纯提供录音功能,20年来都没有改进,而用户拿到录音后去听、去记的过程,更是繁琐的很。

因此,借助语音识别技术,结合搜狗输入法,提供更丰富的服务,可以突破录音笔这个行业的天花板,在企业会议、学习培训、媒体采访、写作记事等领域充分提供服务。

简单来说,原来你觉得整理录音太麻烦,还不如现场记,因此不会购买录音笔;但如果整理录音的过程变简单,能让你更方便的整理老板在会上的讲话、老师在课上讲的知识点,或者直接用语音输入来写作,这样,你就会选择入手一支录音笔。

行业的天花板,被升高了。

不过,让合作伙伴的产品也能用上搜狗的听写能力,为什么不选择直接做一个开发者平台,让全部的开发者都能接入API来实现呢?

“开放的是服务,不是技术”,杨洪涛这样说。

在他看来,市面上的语音识别API已经相当多了,搜狗不希望再去做一个开放平台,而是利用搜狗的优势,提供具备产业价值和商业价值的服务。

而这,也是搜狗将听写服务与搜狗输入法中的用户定制词库连接起来的原因。

最后,除了听写能力之外,搜狗公司AI交互技术中心总经理王砚峰表示,未来搜狗的AI分身、变声、同传等在行业内有竞争力的、能提供完整服务体验的能力都会逐步开放。

加入社群 | 与优秀的人交流

小程序 | 全类别AI学习教程

量子位 QbitAI · 头条号签约作者

վ'ᴗ' ի 追踪AI技术和产品新动态

喜欢就点「好看」吧 !

搜狗听写,现在是录音笔硬件的“操作系统”了相关推荐

  1. AI持续赋能,搜狗S1会给录音笔行业带来哪些新变化?

    作者 | 持续赋能的 出品 | CSDN(ID:CSDNnews) 2月26日,在以"同舟共记"为主题的"2020搜狗AI录音笔新品线上发布会"上,搜狗重磅推出 ...

  2. Linux运维基础(硬件和操作系统)

    VMware Workstation的使用: 虚拟机 虚拟计算机 在一个主机上,软件+硬件模拟出的硬件设备,然后在虚拟出来的设备上安装系统,等同于在物理机上的操作! 现代计算机设备的组成部分: 运算器 ...

  3. 001 从硬件到操作系统到软件的进击

    看了鸟哥的Linux的第0章,为了让自己的知识得到巩固,因此写下这个笔记. 了解计算机的世界,需要从大体上对计算机有一个基础的了解,首先,我们了从基础的计算机组成分开始,计算机出生的比我早,从我了解计 ...

  4. 转写准确率95%,搜狗开放AI技术实现录音笔行业进化

    8月28日,搜狗在京举行了"全新「声」态  AI未来"搜狗听写服务开放暨AI创新联盟成立发布会.会上,搜狗宣布将面向录音笔行业开放自身听写服务,并与爱国者.纽曼.索尼录音笔.万城集 ...

  5. 索尼录音笔怎么导出录音内容_搜狗新品发布,引领录音笔行业走向AI时代!

    今日(2月26日),搜狗公司举办了名为"同舟共记"的AI录音笔新品线上发布会.发布会上,搜狗除了正式发布S1.E1两款AI录音笔新品外,还与故宫宫廷文化合作推出了S1和C1 Pro ...

  6. Q2财报后股价遭重挫,搜狗的AI招牌也失灵?从翻译录音笔体验看背后的花拳绣腿...

    作者|震霆            出品|遇见人工智能        公众号|GOwithAI 对搜狗来说,昨天过得应该不轻松,或者可以说水深火热. 一边是大肆传播其Q2的"亮眼财报" ...

  7. AI录音笔战场:搜狗与科大讯飞的对决

    ​ 在AI盛行的时代,互联网公司的发展与AI技术息息相关,人工智能硬件落地已经成为AI技术的重要"归宿". AI盘活录音笔市场 在日常生活中,包括学生做课堂笔记.记者媒体采访.办公 ...

  8. 搜狗翻译宝Pro再次开挂,智能翻译硬件成中国人工智能的新风口

    文|龙红梅 来源|智能相对论(ID:aixdlun) 第五届世界互联网大会正在如火如荼的举行.5G技术.刷脸进景区.扫二维码点外卖等黑科技齐齐亮相乌镇,其中颇为亮眼的是,大会首次启用官方翻译机.而搜狗 ...

  9. 【Linux】一文简单了解操作系统在硬件中的作用,解析操作系统是做什么的?

    目录 前言 一.操作系统的介绍 二.计算机软件体系结构 1.接口 2.各层接口 3.系统调用 三.操作系统做什么 1.不要让CPU打盹 1.1多道程序 1.2分时系统 1.3多任务系统 2.设备驱动 ...

最新文章

  1. creat_caltab生成六边形标定板(黑底白点)
  2. Python开发【第5节】【函数基础】
  3. Python学习笔记 (1)Hello World(环境搭建+输出Hello World!)...
  4. Codeforces 313
  5. 在树洞里,渝粤题库在线整理
  6. 设计模式 里氏替换原则
  7. Eclipse运行程序报错: Errors running builder ‘Integrated External Tool Builder‘ on project
  8. Zabbix监控Nginx连接状态
  9. Normalize.css的使用及下载
  10. 如何将png图像转换成jpg格式呢?
  11. 怎么可以修改pr基本图形中的文字_视频剪辑 | pr的简单教学
  12. input表单开始时间和结束时间的选取,laydate
  13. Android 8.0中各种通知写法汇总
  14. 用计算机MR,常用计算器上的M+,M-,MC,MR都是什么意思,该怎么用?
  15. w10计算机恢复出厂设置,如何给win10系统的电脑强制恢复出厂设置
  16. 易方机器人教育怎么样_易方机器人教育加盟费用
  17. 【外文翻译】图像中的傅里叶变换
  18. android设备判断是否支持NFC功能
  19. 适合零基础学习Python的书籍
  20. 基于STM32单片机的水质监测系统(Proteus仿真+程序)

热门文章

  1. Prometheus AlertManager 微信报警配置
  2. 如何用课件制作工具演示面积一定的矩形
  3. linux NFS配置:NFS相关概念及其配置与查看
  4. hadoop : hdfs的心跳时间设置及心跳检测算法
  5. C#正则提取HTML中img的url值
  6. iOS中判断程序是不是第一次运行(新手引导界面用)
  7. 关于webrtc视频会议的解决方案
  8. C#播放flash动画即swf文件
  9. Kali Linux快速切换root用户
  10. Swift2.0语言教程之类的方法