乾明 编辑整理
量子位 出品 | 公众号 QbitAI

前两天,量子位报道了韩国小哥语音合成论文与英伟达撞车一事。

在得知自己的论文与英伟达的论文“撞车”之后,韩国小哥赶紧在arXiv上提交了论文。并在GitHub上放出了自己研究的源代码。

然后,在Reddit上分享了自己的这一遭遇,引发了大量围观。

英伟达论文的作者之一、负责应用深度学习的副总裁Bryan Catanzaro在回帖中点赞,并且抛出了橄榄枝,希望发帖者能够去英伟达实习。

韩国的小哥有没有联系他,就不得而知了。

但是,英伟达也“赶紧”把自己研究的代码开源了。

主要内容一共有3个部分、10个小步骤,分别为设置、使用英伟达预置的模型生成音频、训练自己的模型。

英伟达的这个项目,名叫WaveFlow,是一个用于音频合成基于流的生成网络。

关于WaveFlow

英伟达的研究团队介绍称,WaveGlow结合了OpenAI的生成网络Glow和DeepMind的WaveNet,能够提供快速,高效和高质量的音频合成,而无需自动回归(auto-regression)。

而且,WaveGlow只用单一成本函数进行训练,然后使用单一网络实现,整个训练过程非常简单,而且也很稳定。

他们也介绍了使用PyTorch进行论文实现的情况:

在NVIDIA V100 GPU上以超过500 kHz的速率产生音频样本,平均意见得分表明,它合成的音频质量与最佳的公开WaveNet实现一样好。

在英伟达的官方网站上,研究团队发布了合成音频,及其与原始音频、开源WaveNet合成音频的对比(第一遍为原始音频,第二遍为WaveNet合成音频,第三遍为WaveGlow合成音频):

传送门

英伟达GitHub地址:
https://github.com/NVIDIA/waveglow

英伟达论文地址:
https://arxiv.org/abs/1811.00002

韩国小哥GitHub地址:
https://github.com/ksw0306/FloWaveNet

韩国小哥论文地址:
https://arxiv.org/abs/1811.02155

年度评选申请

加入社群

量子位AI社群开始招募啦,欢迎对AI感兴趣的同学,在量子位公众号(QbitAI)对话界面回复关键字“交流群”,获取入群方式;

此外,量子位专业细分群(自动驾驶、CV、NLP、机器学习等)正在招募,面向正在从事相关领域的工程师及研究人员。

进专业群请在量子位公众号(QbitAI)对话界面回复关键字“专业群”,获取入群方式。(专业群审核较严,敬请谅解)

活动策划招聘

量子位正在招聘活动策划,将负责不同领域维度的线上线下相关活动策划、执行。欢迎聪明靠谱的小伙伴加入,并希望你能有一些活动策划或运营的相关经验。相关细节,请在量子位公众号(QbitAI)对话界面,回复“招聘”两个字。

量子位 QbitAI · 头条号签约作者

վ'ᴗ' ի 追踪AI技术和产品新动态

语音合成论文与韩国小哥“撞车”后续:英伟达“赶紧”把代码开源了相关推荐

  1. 谷歌查看html地址_104篇CVPR 2019论文,追踪谷歌、Facebook、英伟达研究课题

    [新智元导读]人工智能顶级会议CVPR刚刚公布了最佳论文,谷歌.Facebook和英伟达也随后公布了自家发表的论文共计104篇,本文列出了三家大厂论文的完整列表. 本周,在美国加利福尼亚州长滩举办了C ...

  2. 语音合成论文和英伟达撞车,韩国小哥紧急放出全部草稿代码和样本 | 资源帖...

    晓查 发自 凹非寺 量子位 报道 | 公众号 QbitAI 由于和英伟达研究撞车,韩国一位研究语音合成的作者已经哭晕了. 10月31日,英伟达在arXiv网站上传了一篇论文--WaveFlow:一个用 ...

  3. 线下沙龙 | 小身材大能量!用英伟达智能小车Jetbot玩转深度学习

    8 月 14 日(周日)下午,PaperWeekly 将携手 NVIDIA 英伟达在上海举办新一期线下沙龙. 针对具有基本 Python 编程技能的学生和开发者,本次线下沙龙将通过对市场售价 1880 ...

  4. 线下沙龙 × 上海 | 小身材大能量!用英伟达智能小车Jetbot玩转深度学习

    8 月 14 日(周三)下午,PaperWeekly 将携手 NVIDIA 英伟达在上海举办新一期线下沙龙. 针对具有基本 Python 编程技能的学生和开发者,本次线下沙龙将通过对市场售价 1880 ...

  5. 入门NLP、实现语音识别和语音合成,用这个开源工具SoEasy | 英伟达NLP公开课

    对话式AI正在改变人机交互方式,在生活和工作中给我们带来很大便利. 然而,对话式AI包含自动语音识别.自然语言处理.语音合成等技术领域,从0开发一个对话式AI需要投入的成本和流程非常之多. 那么,有什 ...

  6. 直播报名 | 小身材大能量!用英伟达智能小车Jetbot玩转深度学习

    8 月 14 日(周三)下午,PaperWeekly 将携手 NVIDIA 英伟达在上海举办新一期线下沙龙. 针对具有基本 Python 编程技能的学生和开发者,本次线下沙龙将通过对市场售价 1880 ...

  7. 百度英伟达联手推混合精度训练,同样性能只需一半内存 | 附论文

    夏乙 编译整理 量子位 出品 | 公众号 QbitAI 这几年来,各科技大厂搞出了越来越大的神经网络,达到了越来越高的准确率,但同时,这些模型对内存和计算力的要求也越来越高. 于是,有一部分研究者想要 ...

  8. 一文盘点NeurIPS'22杰出论文亮点!英伟达AI大佬一句话总结每篇重点,一并看透今年技术趋势...

    Pine 明敏 发自 凹非寺 量子位 | 公众号 QbitAI 15篇NeurIPS'22杰出论文重磅出炉,具体亮点都是啥? 来来来,大佬已经帮你总结好了! 师从李飞飞,现在在英伟达工作的大佬,用49 ...

  9. 英伟达小姐姐的Python隐藏技巧合集,推特2400赞,代码可以直接跑

    本文经AI新媒体量子位(ID:QbitAI)授权转载,转载请联系出处 常常发资源的英伟达工程师小姐姐Chip Huyen,又发射了一套Python隐藏功能合集. 里面都是她"从前没发现,或者 ...

最新文章

  1. wes 7 gost 下载_南京地铁实现移动5G全覆盖下载速度快到飞起_机房360
  2. 黑鹰长期班.边程浪子系列教程
  3. 引领潮流云电视机遇与挑战并现
  4. 机器学习 聚类篇——DBSCAN的参数选择及其应用于离群值检测
  5. python3将列表当作队列使用
  6. VTK:图片之ImageValueRange
  7. SAP License:标准价格修改
  8. spring boot (整合redis)
  9. 《统计学基本概念和方法》读书笔记+读后感(1)
  10. it有啥好咨询的_蓝盟浅析,IT外包的四种常用方式
  11. 如何写软件设计文档?
  12. 计算机应该怎样复制桌面,电脑全屏复制快捷键是什么(史上最全电脑快捷键集合)...
  13. 关于poi处理word换行问题
  14. ios - 农历公历互转 农历选择器
  15. 如何一键修改CAD图纸底图颜色?
  16. Python爬虫-爬取豆瓣读书
  17. 多普达同步软件4.5_我试用过的十几款记账软件
  18. 计算机教学中因才施教,在信息技术教学中如何体现因材施教的原则
  19. 计算机编写代码简介,Vcomputer简介
  20. 多输入数字求和python123

热门文章

  1. 滴滴又出事!33项问题被查,程维再次致歉
  2. Java高级面试题!docker启动
  3. 满满干货!mysql定时任务每天固定时间执行
  4. java语法结构库,万字解析!
  5. 第 0 章 阳哥MySQL高级
  6. 第 1 章 课程概述
  7. ieee期刊的科技写作思路曹文平_科学网—怎样向IEEE期刊投稿* - 吴雄君的博文
  8. public 返回一数组_数组:滑动窗口拯救了你
  9. java 输入怎么写_java我要怎么写如果输入6是输出是122333444455
  10. jvm调优工具_JVM性能调优监控工具jps、jstack、jmap、jhat、jstat、hprof使用