8月28日,搜狗在京举行了“全新「声」态  AI未来”搜狗听写服务开放暨AI创新联盟成立发布会。会上,搜狗宣布将面向录音笔行业开放自身听写服务,并与爱国者、纽曼、索尼录音笔、万城集团四家数码科技头部企业成立AI创新联盟。

搜狗听写服务基于搜狗AI语音技术的领先成果,可向用户提供音频文件云存储、音频转写、多端同步编辑等一站式服务。用户可通过PC端、App端、Web端任一渠道接入该服务,实现录音文件实时文本转写。同时,已完成的录音可以进行非实时录音转写,支持1小时音频最快5分钟出稿。值得注意的是,音频直接转写准确率高达95%以上。

开放听写服务 成立AI创新联盟

此前,搜狗推出的智能录音笔C1兼具高清晰度和轻便携性,满足了相关用户的使用需求,在市场上获得了一致好评。一直以来,传统录音行业的研发重点都在于人声保真和场景降噪,录音音频的后续生产力转化一直被行业所忽略。搜狗智能录音笔备受市场偏爱,除了其出色的收音效果,还在于搜狗听写服务的支持。基于搜狗听写服务,搜狗创新性地开拓出一个专业化的录音文件后期智能处理平台,帮助用户轻松实现录音音频向文字的转化,有效节省人力和时间成本。

发布会现场,搜狗还联合爱国者、纽曼、索尼录音笔、万城集团成立了AI创新联盟,这四大录音笔生产厂商的加盟,将在AI智能录音笔产业带起一场软件与硬件的碰撞。产品AI化,是5G互联网时代的大趋势,电子设备通过人工智能的加持,不再死板僵硬缺少变通性,而会越发智慧化、便捷化。本次发布会后,搜狗面向全行业开放听写服务,不仅为传统录音笔行业提供了AI技术后盾,使音频不仅“可听”而且“可看”,也推动着多年来进度滞缓的录音笔行业实现创新跃迁式发展。

自主研发AI技术关注细节体验

对于技术行业来说,一些关键技术的突破点往往在于产品细节问题的处理上。搜狗通过对AI语音技术的自主研发,对录音实时转写进行技术优化,实现转写结果超过95%的精准度,搜狗公司AI交互技术中心总经理在发布会现场对搜狗听写服务进行了详细的技术解析。

目前搜狗输入法语音请求峰值已超7亿次,稳居全球最大的中文语音应用,依托于此,搜狗听写服务背后的转写技术已处于行业领先地位,其实时语音转写运用了搜狗自研的延迟可控的Adaptive Attention-based端到端建模技术,非实时语音转写功能使用业界领先的深层Transformer-based端到端语音识别技术,语音转写准确率可达95%以上。在语音增强方面,搜狗自研的Smart Voice麦克风阵列算法能够对噪声和混响进行多重深度优化,确保人声的高保真还原。在智能辅助编辑方面,搜狗语音转写可以通过云端智能纠错编辑技术,基于词图搜索和输入纠错模型,针对置信度低的转写结果提供多个候选词,帮助用户对转写结果进行纠正,同时还具备了良好的自动区分说话人、智能文本顺滑和标点预测等能力,可以为用户提供更多便捷功能。

AI推进技术变革 专业设备专业化

智能手机的出现,对具有重合功能的电子设备行业带来巨大冲击力。以传统录音笔行业为例,录音笔可实现的音频记录功能,移动智能手机也可实现,且在使用体验方面,两者并无显著差异。互联网时代,一个产品失去了差异化优势几乎等于走向消失。而搜狗开放听写服务,恰能以AI技术助力录音笔产品便捷实现智能化升级。基于前沿AI语音技术,搜狗听写服务率先在业内实现了录音文件后期的一键加工处理,补足了“音频转文字”方面用户使用场景链条的完整结构,真正提升录音笔的便捷性,拉开其与手机产品的专业化差距。

爱国者、纽曼、索尼录音笔、万城集团这四家数码科技品牌在互联网界拥有举足轻重的地位,旗下录音笔相关产品销量占据业界半壁江山,此次与搜狗联合成立AI创新联盟也发出了传统录音行业寻求突破转型的信号。三大巨头对搜狗开放听写服务给予高度评价和大力支持,预示着录音行业将迎来一场变革,智能录音笔及后期处理平台势将形成新的AI智能产业链,对有录音需求的相关行业也会带来颠覆性变革,引领录音行业实现智能升级。

转写准确率95%,搜狗开放AI技术实现录音笔行业进化相关推荐

  1. ai技术与能源行业_最终AI能源效率的新方程式

    ai技术与能源行业 How energy-intensive is the AI infrastructure today? And what does that mean for the futur ...

  2. 蚂蚁金服高级技术专家李福喜 :蚂蚁开放平台技术路线及行业实践

    8月30-31日20:00-21:30,一场别开生面的技术大会-- "蚂蚁金服&阿里云在线金融技术峰会"将在线举办.本次将聚焦数据库.应用架构.移动开发.机器学习等热门领域 ...

  3. 腾讯「AI In All」的背后,是开放AI技术能力,探索腾讯应用场景

    来源:灯塔大数据 概要:过去一年中,我们听到不少公司在谈到未来的时候都会谈到一个词,叫做「All In AI」,腾讯在 AI 方面的战略也用一个词概括,那就是「AI In All」. 「过去一年中,我 ...

  4. 索尼录音笔怎么导出录音内容_搜狗新品发布,引领录音笔行业走向AI时代!

    今日(2月26日),搜狗公司举办了名为"同舟共记"的AI录音笔新品线上发布会.发布会上,搜狗除了正式发布S1.E1两款AI录音笔新品外,还与故宫宫廷文化合作推出了S1和C1 Pro ...

  5. 架构师实践日 · 6.30 杭州站 | 视觉 AI 技术如何助力行业提升?来西子湖畔与业内大咖面对面交流!

    伴随内容形式的变迁(文字 → 图片 → 视频),目前视觉 AI 技术不仅被应用到传统领域的升级革新中,还作为最重要的基础人工智能技术渗透到前沿技术的创新研究中. 七牛架构师实践日第二十九期将以视觉 A ...

  6. 蚂蚁金服首席数据科学家漆远:AI技术开放,与业界融合共创

    小蚂蚁说: 11月8日,在第五届世界互联网大会-<人工智能:融合发展新机遇>论坛上,蚂蚁金服副总裁.首席数据科学家漆远认为AI具有控制风险.降本增效和提升用户体验三大作用. 11月8日,第 ...

  7. 王砚峰揭秘搜狗AI技术体系:自然交互在左,知识计算在右,核心是语言丨MEET2020...

    郭一璞 整理自 MEET2020智能未来大会 量子位 报道 | 公众号 QbitAI 从虚拟主播.录音笔到AI同传,搜狗这家公司落地了各种各样的AI应用,并且直接让用户有所感知. 这些看起来神奇的应用 ...

  8. AI持续赋能,搜狗S1会给录音笔行业带来哪些新变化?

    作者 | 持续赋能的 出品 | CSDN(ID:CSDNnews) 2月26日,在以"同舟共记"为主题的"2020搜狗AI录音笔新品线上发布会"上,搜狗重磅推出 ...

  9. 搜狗的2019年:录音笔开辟智能硬件新战场,语言AI要在C端找准点

    晓查 发自 凹非寺  量子位 报道 | 公众号 QbitAI 回顾即将过去的2019年,这一年AI领域的行业关键词是"落地",至于到底落在哪里,每家公司都有不同的见解. 在搜狗CE ...

最新文章

  1. FFmpeg命令行map参数选择音视频流
  2. 获取WebView加载的网页内容并进行动态修改
  3. 使用Speedment 3.0.17及更高版本简化交易
  4. 安装NTOP网络监控工具(wheezy)
  5. matplotlib设置画布大小_PyTorch 49.matplotlib模块
  6. 从潘叔到潘子,潘长江走下「神坛」
  7. cf不能全屏win7的解决方法_win10玩cf不能全屏的解决方法教程
  8. 诺基亚E72_RM-530刷机包023.002版
  9. python视频大全
  10. FSDB Dumper
  11. hardfault常见原因_STM32 出现 hardfault_handler 处理方法
  12. VMware ESXi 与ESX 产品之比较
  13. 公立计算机大学排名,全国公办软件工程大学排名
  14. 国外计算机著名核心期刊介绍(转)
  15. iOS字体像数与磅的对应关系
  16. cool edit工具介绍及使用
  17. 分析:人名搜索Spock会成下个谷歌吗
  18. android广播不同app,用广播(Broadcast)实现不同app之间的通信
  19. PWM转换为模拟信号(积分电路)
  20. Linux 探索之旅 | 第一部分第四课:磁盘分区 + 完成 Ubuntu 安装

热门文章

  1. VC++中按钮,文本框,选择框的常用方法
  2. [vscode] 推荐插件及配置
  3. Pytorch Dataset、Dataloader的简单理解与使用
  4. 创建完虚拟环境后安装pytorch
  5. 百度强化学习之Policy learning
  6. 记录——《C Primer Plus (第五版)》第八章编程练习第二题
  7. boost::asio的C/S结构笔记
  8. Ubuntu16.04安装Spacevim插件
  9. Flutter框架基础
  10. 中国碳酸亚乙酯(EC)(CAS+96-49-1)行业市场供需与战略研究报告