▲ 内容预览:

  • 百度实现文本到语音的实时转换

  • Facebook 发布支持 90 种语言的预训练词向量

  • 英伟达发布 GTX 1080 TI

    每日推荐阅读:

  • 高手实战演练,十大机器学习时间序列预测难题

  • 从零起步,基础机器学习模型和算法的 Python 代码实现

█ 百度 Deep Voice,实现文本到语音的实时转换

雷锋网消息,今日百度公开宣布了 Deep Voice,一个产品级的文本到语音转换( text-to-speech,TTS)系统。

该系统完全由深度神经网络搭建而成,最大的优势在于能够满足实时转换的要求。在以前,音频合成的速度往往非常慢,需要花费数分钟到数小时不等的时间才能转换几秒的内容,而现在,百度研究院已经能实现实时合成,在同样的 CPU 与 GPU 上,系统比起谷歌 DeepMind 在去年 9 月发布的原始音频波形深度生成模型 WaveNet,要快上400倍。

但在目前,Deep Voice 需要借助一个音素模型与音频合成组件的帮助。百度研发团队希望在未来能够实现真正意义上的端到端(end-to-end)语音合成。

详情:http://research.baidu.com/deep-voice-production-quality-text-speech-system-constructed-entirely-deep-neural-networks/

论文:https://arxiv.org/abs/1702.07825

█ Facebook 发布支持 90 种语言的预训练词向量

还记得 FastText 吗?就是那个 Facebook 为大型数据库文本处理发布的开源工具。今日,FastText 研究团队在 GitHub 发布了他们的最新研究成果——使用维基百科训练,并包括 90 种语言的 300 维词向量;全都使用  FastText 的默认参数进行训练。

FastText 团队表示,希望各路开发者提供使用反馈。另外,一大波新模型即将发布,请关注雷锋网(公众号:雷锋网)的后续报道。

支持语言列表与下载地址:https://github.com/facebookresearch/fastText/blob/master/pretrained-vectors.md

█ 英伟达发布 GTX 1080 TI,性能赶超 Titan X

今日(当地时间 28 日晚),英伟达在 GDC 大会上发布了 GTX 1080 TI。该显卡仍采用帕斯卡 16 nm 制程工艺,热设计功耗 250W,配备 11GB GDDR5X 显存。英伟达表示其性能超过 GTX 1080 约 35%。这使得 GTX 1080 TI 与 Pasal Titan X 的性能不相上下,部分非公版型号甚至可能犹有过之。

另外,GTX 1080 TI 的公版外观与 GTX 1080 一般无二。但英伟达在发布会上宣布,其公版散热得到了改进,包括去掉 DVI 接口以增大显卡出风口面积;使得在同等噪音水平下,相比 1080/1070 上的公版散热,新方案效果提升约 5%。

GTX 1080 Ti 将于下周上市,售价仅为 699 美元(约合人民币4808元),首批只有公版。美国销售的 GTX 1080 已开始降价,据雷锋网了解,多家零售商降幅达到 100 美元。

虽然 GTX 1080 TI 主打游戏市场,但对于深度学习开发者,只需花费泰坦一半多的价格就能买到相差无几的计算性能,具有非常大的诱惑力。目前国行价格尚未公布,雷锋网会继续关注。

详情:http://www.leiphone.com/news/201703/dv5c5cO4OvBe7brF.html

每日推荐阅读

高手实战演练,十大机器学习时间序列预测难题

这是我们的老熟人、澳大利亚机器学习专家 Jason Brownlee 最新整理的开发者实操练习。这是十道颇具挑战性的时间序列预测问题。对于这十道难题,经典的线性统计方法不足以进行解决,必须要用到高阶机器学习方法。

这些难题均来自 Kaggle。

如果你想要来点能挑战自己的高难度习题,提高处理时间序列数据集的能力,并演练机器学习技术——这十道题就是给你的。

地址:http://machinelearningmastery.com/challenging-machine-learning-time-series-forecasting-problems/

从零起步,基础机器学习模型和算法的 Python 代码实现

国外机器学习开发者 Erik Linder-Norén,把他创建多种机器学习模型所用的 Python 代码,上传到了 GitHub 与大家分享。一起来看看别人家的模型是什么样的。当然,这些算法真的是从零起步,非常基础,对于新手有最大的参考价值。

Erik Linder-Norén 上传的模型代码包括决策树、逻辑回归、多层感知机、随机森林、支持向量机等。

地址:https://github.com/eriklindernoren/ML-From-Scratch

相关文章:

Google Summer of Code 2017合作机构名单;英特尔 12 核 Skylake-X | AI 开发者头条

本文作者:三川
本文转自雷锋网禁止二次转载, 原文链接

百度 Deep Voice 实现文本到语音的实时转换;GTX 1080 TI 发布,性能超 Titan X | AI 开发者头条...相关推荐

  1. 蓝牙、WiFi 版树莓派发布;日韩三巨头联手推出 AI 语音助手 Clova | AI 开发者头条...

    ▲ 内容预览: 树莓派也有蓝牙和 Wifi 啦! 日韩三巨头联手,推出 AI 语音助手 Clova 微软发布 Azure Stack  第三技术预览版本 每日推荐阅读 14 步教会你用 Python ...

  2. 百度发布 PaddlePaddle 新 API;微软更新 Linux 平台虚拟机 DSVM 等 | AI 开发者头条

    ▲内容预览 百度发布 PaddlePaddle 新 API,以及免费手册<使用 PaddlePaddle 进行深度学习> 微软更新 Linux 平台的数据科学虚拟机(DSVM) 谷歌发布机 ...

  3. 百度Deep Voice 1 2 3阅读笔记

    7. Deep Voice: Real-time Neural Text-to-Speech 文章于2017年3月发表 Deep Voice是使用DNN开发的语音合成系统,主要思想是将传统参数语音合成 ...

  4. html语音文字实时转换,js将文字转化为语音并播放

    百度地图将文字转化为语音并播放 /*function doTTS() { var ttsDiv = document.getElementById('bdtts_div_id'); var ttsAu ...

  5. 长按发送语音_MIUI 11指尖通话功能,实现语音文字实时转换,米粉值得一试!...

    现在的手机功能是越来越强大了,也为我们的生活带来了很多便利,而小米的MIUI系统就是其中之一,大大方便了我们的工作和生活~ 今天小编就和大家说一说小米手机中的语音功能,不知道在看的小伙伴都了解多少呢? ...

  6. 语音合成TTS(Text-To-Speech,从文本到语音)

    以上内容,来自饭团"AI产品经理大本营",点击这里可关注:http://fantuan.guokr.net/groups/219/ 作者:黄钊,5年AI实战经验(图灵机器人),8年 ...

  7. 【论文翻译】Deep Voice 3:通过卷积序列学习来扩展语音合成

    Deep Voice 3 引入了全卷积序列到序列式模型来进行语音合成,这种新架构在语音训练速度上有了数量级的提升,经过800 多个小时的语音数据学习,它可以合成 2400 多钟不同的语音结果.Deep ...

  8. python视频处理转语音_文本转语音(普通话粤语)_Python视频剪辑自动化

    利用百度翻译接口, 实现文本转语音 now you see me now you see me now you see me now you see me now you see me now you ...

  9. 百度语音系统Deep Voice新突破 可在几秒内克隆你的声音

    文章来源:ATYUN AI平台 百度的AI研究部门近日宣布,其文本到语音(TTS)系统"Deep Voice"已经学会了如何使用仅三秒钟的语音样本数据来模仿人类的声音. 这项技术被 ...

最新文章

  1. thinkPHP5.0中使用header跳转没作用
  2. 设计模式C++实现(9)——享元模式
  3. Intellj idea启动tomcat配置
  4. [云炬创业学笔记]第一章创业是什么测试10
  5. 国产统一操作系统(UOS)安装、体验
  6. (转)金融从业者将被人工智能取代?
  7. 世上哪有那么多的怀才不遇
  8. C++ 常用代码大全
  9. eclipse的下载及安装教程
  10. excel离散度图表怎么算_怎么在excel中计算散点图的公式
  11. tomcat编码配置gbk_修改Tomcat编码方式的两种方法
  12. Excel单页导出以及多sheet导出
  13. FPGA中for语句描述的七人投票表决器
  14. 硬件电路设计基础知识
  15. 二元一次方程,且求共轭复根2020.11.17
  16. 实例解析云计算的概念
  17. CCF CSP刷题—小中大
  18. C语言 猜数游戏 首先由计算机产生一个随机数,并给出这个随机数所在的区间,然后有游戏者猜测这个数。猜中游戏结束,并可以重新挑战,猜错重新给出提示,如果猜测超过八次游戏失败。
  19. LogLog Counting
  20. iPhone 4s完美越狱 iOS 5.1 完美越狱 苹果越狱

热门文章

  1. Panda白话 - Synchronized底层同步机制
  2. 「实在RPA·生物医疗数字员工」为医疗行业「医」路赋能
  3. html5基本页面结构,HTML 5 基础教程
  4. 收藏这些Safari快捷键,让你的Mac浏览网页更加方便
  5. ARM_UNWIND_BACKTRACE (2)
  6. 13 facebook 国外面试
  7. 带容量约束的p-中心选址问题建模与求解
  8. 了解常用 Markdown 扩展语法
  9. make patsubst
  10. PostgreSQL与es的数据同步方案调研