丰色 发自 凹非寺
量子位 报道 | 公众号 QbitAI

先来听一段歌:

你能听出来,这其实是小冰和真人共同演唱的吗?

蓝色为小冰,白色为真人,是不是非常难以分辨?

这背后就是小冰今天发布的全新超级自然语音技术

该技术首次将人工智能语音自然度提升到与真实人类声音几乎无法分辨的程度。

也是全球首个全域通用的同类技术

也就是说,除了上面的唱歌,说话、跟人交谈等场景都能进行高度拟人交互

再来看两个demo。

下面是一段独白的音频。

其中只有一句来自人类,其余全都是由小冰说的。你能听出来真实人类说的是哪一句吗?

接下来,你会听到两个在直播间唠嗑的女生,这一次,“她俩”都不是人类。

这也是小冰官网上的一个实验,对话已经持续了88天,并且将一直持续下去,永不中断。

小冰表示,该实验近期将逐步拓展至第三方直播平台

而目前,小冰团队的每个成员都已有人工智能替身,官方的演示视频的主持也是用的替身。

并且,小冰框架中的数百个不同人工智能原型主体,已全部完成这项超级自然语音技术的升级

小冰框架

关于这个真假难辨的超级自然语音技术的细节目前还未透露

但最新的第八代小冰,已经可以量产各种AI角色:去企鹅电竞做直播间助手、或者当销售卖卖化妆品、甚至当公众号小编……唱歌跳舞写文章样样精通。

生产这些角色背后的小冰框架,主要技术包括:

实现长程语音交互的全双工语音交互感官
提高小冰对于对话内容、领域和节奏的控制力的共感模型
融合了全双工语音交互、实时视觉与核心对话引擎的多模态交互感官
让小冰唱歌像真人一样的第四版人工智能歌曲DNN模型等等

而与同行相比,小冰框架最大的差异化在于,它是一个“session-oriented”的人工智能框架,框架中的各部分技术共同为“交互全程”目标服务,而不仅仅关注并优化局部。

比如,在核心对话引擎方面,技术的研发及迭代方向是为更有效地预测、保持并引导对话,而不是仅仅实现回应。

在语音方面,框架关注语音交互的质量与体验是否能支持长时间的混合交流,而不仅仅是将文本内容转为语音。

已完成A轮融资

与此同时,小冰也在今天宣布:已完成A轮融资,估值已达10亿美元

本轮融资由高瓴领投,五源、Neumann、IDG、GGV纪源资本,以及上轮投资人北极光与网易跟投。

2014年问世的微软小冰,是全球承载交互量最大的完备人工智能框架之一,技术覆盖自然语言处理、计算机语音、计算机视觉及人工智能内容生成。

为了加速发展,小冰团队于2020年7月从微软独立。

并于去年11月完成了数亿元的Pre-A轮融资。

加上此次A轮的完成,也就是说只用一年时间,小冰的估值已经达到超独角兽规模。

最后,小冰表示,更多创新,九月年度发布会见。

那么,你对第九代小冰还有怎样的期待呢?

小冰超级自然语音技术发布!PK真人真假难辨,同时获独角兽轮融资相关推荐

  1. 财富管理技术服务商NewBanker完成千万级美元 Pre-C 轮融资

    3月25日消息,独立财富管理技术服务商NewBanker宣布,已完成由凡创资本领投,经纬出行基金以及老股东元生资本.经纬中国以及阿特列斯资本跟投的千万美元级 Pre-C 轮融资. NewBanker ...

  2. 财富管理技术服务商NewBanker完成千万级美元 Pre-C 轮融资...

    3月25日消息,独立财富管理技术服务商NewBanker宣布,已完成由凡创资本领投,经纬出行基金以及老股东元生资本.经纬中国以及阿特列斯资本跟投的千万美元级 Pre-C 轮融资. NewBanker ...

  3. 获新轮10亿融资,“诗人小冰”又get哪些超强新技能?

    还记得那个会写诗的小冰吗? 五年前,人工智能诗人小冰首次出版了独立创作诗集<阳光失了玻璃窗>.通过对百年来519位中国现代诗人上千首诗歌的1万次迭代学习,小冰开始具备"创作&qu ...

  4. 科大讯飞语音引擎_科大讯飞的1024:语音技术进一步突破,发布专用芯片

    机器之心报道 作者:一鸣.蛋酱 1024 作为程序员的节日被世人所知,而科大讯飞也会在每年这个时候举办开发者节日和相关活动.在今年的开发者节上,科大讯飞发布了更多关于平台,产品和技术方面的信息. 昨日 ...

  5. 少儿全学科知识学习、复习、训练的免费福利,少儿知识训练大师 5.0 全新发布:真人语音、插件题库、全新功能

    孩子全学科复习.强化训练学习的必备工具,各种学科和知识问题库无限发挥.任意组合,配合本地.在线语音合成和识别引擎,为您打造真人级朗读和交互效果,更适合少儿的生动学习场景,本软件还是免费的哦! 新版软件 ...

  6. 干货 | 清华大学郑方:语音技术用于身份认证的理论与实践

    本讲座选自清华大学语音和语言技术中心主任郑方教授近期于清华大数据"技术·前沿"系列讲座上所做的题为<语音技术用于身份认证的理论与实践>的演讲. 以下为演讲的主要内容: ...

  7. 智能语音技术新发展与发展趋势

    本文总结于西工大音频语音与语言处理实验室(ASLP@NPU)负责人-谢磊教授在深蓝学院的公开课--智能语音技术的新进展与发展趋势-NPU-ASLP视角. 大家好!感谢深蓝学院的邀请!我代表西工大音频语 ...

  8. 什么是语音技术及其应用?语音识别的研究意义与进展

    你知道小冰吗?你呼叫过小度吗?你和小娜互动过吗?你使用过Siri吗?如果都没有,那你就out了.它们都是当下很火爆的智能语音机器人,很多人都和它们聊过天. 日前,美国投资机构Mangrove Capi ...

  9. 超七成阅读APP都借百度语音技术促用户增长

    全国十多亿人在这个春节集体"关门闭户"与手机和网络作伴,除了手游和短视频流量飞涨,在线阅读也迎来"高光时刻",特别是当手机阅读APP标配了语音朗读即" ...

最新文章

  1. ASP.NET获取IP的6种方法
  2. SAP Web Intelligence初探
  3. KafkaProducer初始化时,是否会拉取集群元数据?
  4. 1.QT中播放视频,录音程序的编写
  5. Windows Mobile 7(Photon) 梦幻之旅系列-前言
  6. 【警惕】大量未修复WebLogic WSAT组件RCE漏洞的主机被挖矿程序攻击
  7. KVM,QEMU,libvirt入门学习笔记【转】
  8. 嵌套循环连接(Nested Loops), 合并联接(Merge), 哈希联接(Hash)的适用情况
  9. 一如此前的回应,王劲将景驰科技总部搬到了广州
  10. 10个英文手写字体下载
  11. MATLAB绘制柱状图带标准误差线
  12. python声音模拟_5秒钟让python克隆别人的声音
  13. 加州大学洛杉矶分校计算机硕士学费,美国加州大学洛杉矶分校计算机科学硕士.pdf...
  14. 预计招收300人,北京大学信息工程学院2022年夏令营开启报名
  15. 不给别人添麻烦是一种教养还是性格缺陷?
  16. 阿里云服务器被挖矿的解决方法
  17. UPS BP650CH实现nas自动关机
  18. redis集群介绍和搭建 (3个主机,6个实例)
  19. 获取手机的流量信息 /proc/pid/net/dev
  20. 网狐6603服务器列表加载失败,600 秒后将重新加载, ADO 错误:0x80004005,连接失败

热门文章

  1. Action请求后台出现Response already commited异常解决方法
  2. 为什么我可以在Java中抛出null? [重复]
  3. 如何在PHP中删除字符串中的所有空格? [重复]
  4. 如何仅从SQL Server DateTime数据类型返回日期
  5. JUC包中的分而治之策略-为提高性能而生
  6. Bootstrap框架的基本使用
  7. checkpoint process vs writer process vs wal writer process
  8. Mac环境下sublime实现列选择或编辑的方法
  9. eclipse 设置PythonIDE
  10. 关于验证码整理的新版本