必读 | 六月份不容错过的十大重磅好文,机器学习和数据科学的小伙伴拿走不谢

原创 2017-07-10 爱收藏的 AI科技大本营

作者 | Flavian Hautbois

翻译 | AI科技大本营(rgznai100)

参与 | JeyZhang,波波

上个月,我们发了很多文章。但是,机器学习和数据科学整个领域所发表的新文章更多。如何用一篇文章就能梳理好这些最新的内容呢?我们苦思冥想,从中找出了这十篇有关神经网络、TensorFlow、数据可视化、生成式对抗网络(GAN)以及LSTM的最佳文章。

只此一篇,你就能把握住机器学习和数据科学整个领域的新内容,绝对不容错过。

如果你的阅读习惯是边看边动手做,请一定先备好Python环境。

我们先从下面的漫画开始:

图片翻译:

“这个问题已经困扰我们很多年了。”

“不用纠结,让我用算法来替你解决它。”

6个月后…

“哇,你这问题确实好难。”“你不是说……”

➤1 —  Dash入门

Dash提供了一套全新的用于web的图表库,而这篇文章深入介绍了Dash图表库是如何设计的,以及介绍了在Dash中如何有效地处理常见错误以及多重集成。文章中对Excel和R语言系统进行了很合理的对比。使用Dash进行图表实现时,一个技术上的挑战是,你需要维护一个flask应用以及拥有一个对ReactJS友好的前端。

Adil Baaj在我们的博客上发布了一篇对比多种javascript图表库的文章。如果希望入门Dash,可以阅读来自plotly的《Dash入门》。

Dash入门

https://medium.com/@plotlygraphs/introducing-dash-5ecf7191b503

对比多种javascript图表库

https://blog.sicara.com/compare-best-javascript-chart-libraries-2017-89fbe8cb112d/

➤2 —  Google发布用于目标检测的TensorFlow API

Google公司一直致力于让大数据领域最新研究的实现变得更加简单。本月他们在TensorFlow上发布了用于目标检测的API,也发布了适用于移动设备的版本。

详见Google Research Blog的原文:

https://research.googleblog.com/2017/06/supercharge-your-computer-vision-models.html

➤3  — 初识生成式对抗网络(Generative Adversarial Networks, GAN)

这是一篇介绍如何训练一个神经网络来生成手写数字图片的教程。我们很欣赏这种在对抗式网络这个新的研究方向上的实践技术,这又是一个在经典MNIST数据集上做的实验。在这篇文章中,你将得知训练生成式对抗网络是一件困难的事,是因为你需要在生成器与判别器的训练中找到平衡。本教程仅需要大概半小时就能读完,属同类教程中的佼佼者。

详见O’Reilly原文

https://www.oreilly.com/learning/generative-adversarial-networks-for-beginners

➤4  —  使用深度学习技术重构出高分辨率的音频

受到最近图像方面研究的启发,文章作者尝试用低质量的音频文件来重构出分辨率更高的音频,最终音频质量上没有取得大幅度的提高,但也一定程度上达到了目的。尽管实验结果上的提升并不显著,我们仍然认为该篇文章为本月最佳文章之一。原因如下:

  • 本文着重于重构VoIP语音,这点很巧妙。

  • 语音方面的研究工作比较复杂,而深度学习技术的应用除了在语音转文本应用领域之外,其他的较少见到。

我们觉得如果作者在卷积网络中使用频谱表示而不是时间表示的话,实验结果还能再提升一步。

详见Insight Data原文

https://blog.insightdatascience.com/using-deep-learning-to-reconstruct-high-resolution-audio-29deee8b7ccd

➤5  —  探索LSTM

我们破例收录了这篇文章(发表时间在5月30日,严格上说不是6月份的文章),因为文章写得特别好。这篇文章的前半部分是一个LSTM教程,后半部分深入浅出对LSTM作了详解。详解部分使得本文非常有价值。审计 (Audit) 仍然是大数据算法中最困难的部分。正因如此,Edwin Chen做的可视化工具非常棒,因为它详细解析了LSTM的原理。

详见AI科技大本营的完整译文:多图|入门必看:万字长文带你轻松了解LSTM全貌

➤6  —  怎样训练神经网络来自动写代码?

如果你阅读了前面关于LSTM的文章,那么你已经看到了一个关于生成Java程序的例子。来自Thibault Neveu的这篇文章也在尝试做同样的事情。文中使用TensorFlow并且比之前的文章更易于上手,并且更适合做快速阅读。

详见AI科技大本营的完整译文:手把手教你自制编程AI:训练2小时,RNN就能写自己的代码

➤7  —  人工智能让制药业再创辉煌以及所面临的挑战

这篇文章介绍了如何使用生成式对抗网络来生成新的抗癌药物,思路很棒。在制药研究领域有一个Eroom定律,与摩尔定律正相反(随着时间推移,寻找新药的难度呈指数增长)。Mostapha Benhenda强烈呼吁研究人员在大数据与药理学交叉领域上的研究采取行动。

详见Hackernoon原文:

https://hackernoon.com/make-pharma-great-again-with-artificial-intelligence-some-challenges-50e91ea9988d

➤8  —  你所不知道的图表展示小技巧

注意到上面饼状图里一些奇怪的地方了吗?你应该注意到,不过你可能没有(至少我没)。这篇文章详细举例说明了用图表来做比较时的错误用法,从中你会学到在对比两种相似的数据时,图表展示的方式非常重要。

详见Andrew Gelman的原文

http://andrewgelman.com/2017/06/02/youll-never-guess-one-quick-trick-diagnose-problems-graphs-make-improvements/

➤9 — 我在Kaggle上获胜的小技巧

Kaggle是一个数据科学方面在线竞赛平台。公司可以提交赛题以及相关数据集供参赛者解决。Kaggle是一个大型社区,你在上面有机会获得百万美金大奖。这篇文章的作者分享了他从开始时的新手到后来比赛取得第五名的经验。我们认为他总结的参赛小技巧也可供企业数据科学家参考,如果你想参与Kaggle上的竞赛,那么这篇文章将非常值得一读。

详见Dataquest原文

https://www.dataquest.io/blog/kaggle-tips-tricks/

➤10 — 大数据的体现:Amazon收购全食超市的交易

最后再介绍一篇关于商业上Amazon收购Whole Foods超市的文章。随着大数据的研究逐渐渗透商界,我们认为这类文章是这个列表的重要补充。从企业获取数据的角度来看,Amazon收购Whole Foods超市是明智之举。因为Amazon虽然是个大公司,但是数量上远不及Whole Foods超市多,所以收购将为其带来巨大的数据财富。

详见Dataiku:

https://blog.dataiku.com/big-data-is-the-big-news-in-amazon-whole-foods-deal

对于我们选出来的本月十佳文章,你都有看过吗?你心里有没有其他更好的选项?欢迎在评论中告诉我们,如果你们喜欢,咱们下期再见。

原文链接

https://blog.sicara.com/06-2017-best-big-data-new-articles-this-month-5c3478872a61

必读 | 六月份不容错过的十大重磅好文,机器学习和数据科学的小伙伴拿走不谢 原创 2017-07-10 爱收藏的 AI科技大本营 作者 | Flavian Hautbois 翻译 | AI科技大相关推荐

  1. CCAI 2017 | 德国DFKI科技总监Hans Uszkoreit:如何用机器学习和知识图谱来实现商业智能化? 原2017.07.25AI科技大本营 文/CSDN大琦 7 月22 - 2

    CCAI 2017 | 德国DFKI科技总监Hans Uszkoreit:如何用机器学习和知识图谱来实现商业智能化? 原2017.07.25AI科技大本营 文/CSDN大琦 7 月22 - 23 日, ...

  2. AI 开发者不容错过的 20 个机器学习和数据科学网站

    作者 | Oleksii Kharkovyna 责编 | 屠敏 出品 | CSDN(ID:CSDNnews) 以下为译文: 如今,科技界最热门的话题莫过于最先进.最前沿.最令人兴奋的数据科学和机器学习 ...

  3. AIQ |【学界】机器学习、数据科学 如何进阶成为大神?

    转载请注明 AIQ - 最专业的机器学习大数据社区 http://www.6aiq.com AIQ 机器学习大数据 知乎专栏 点击关注 作者: @留德华叫兽 ,美国Clemson大学运筹学硕士,Ph. ...

  4. python的脚本是什么意思_Python的3大用途:Web开发、数据科学、脚本都是啥意思?...

    原标题:Python的3大用途:Web开发.数据科学.脚本都是啥意思? Python是一门脚本语言,因为能将其他各种编程语言写的模块粘接在一起,也被称作胶水语言.强大的包容性.强悍的功能和应用的广泛性 ...

  5. 机器学习、数据科学与金融行业 系列七:金融科技(FinTech)上 --- 基本状况

    机器学习.数据科学与金融行业 系列七:金融科技(FinTech)上 - 基本状况 "The major winners will be financial services companie ...

  6. 机器学习和数据科学领域必读的10本免费书籍

    摘要: 暑期来了,别出去溜达了,看书学习一波- 在这个暑假,有兴趣的可以阅读一下这些免费的有关机器学习和数据科学的书籍,他们能给你打开一扇看清机器学习和数据科学的窗.如果在阅读完这一文章后想知晓更多免 ...

  7. 机器学习和数据科学从业者必读的10本免费英文书

    本文编译自https://www.kdnuggets.com/2018/05/10-more-free-must-read-books-for-machine-learning-and-data-sc ...

  8. 春节充电 | 送你10本机器学习和数据科学必读书(附PDF下载)

    作者:Matthew Mayo 翻译:肖镇东 校对:梁傅淇 本文共1800字,建议阅读6分钟. 让一系列免费的机器学习与数据科学书籍开启你的假期学习之旅吧! 在读完本文列出的书单之后,如果你想要更多免 ...

  9. 机器学习、数据科学与金融行业 系列八:金融科技(FinTech)下 --- 趋势分析

    机器学习.数据科学与金融行业 系列八:金融科技(FinTech)下 - 趋势分析 续-     在上篇中,我们主要介绍了金融科技的关键技术和应用,以及两个重要地领域RegTech和SupTech.在本 ...

最新文章

  1. 29 仿京东放大镜案例
  2. 用深层神经网络解释大脑的运作
  3. DNS、IP地址、子网掩码和网关
  4. 别琢磨了,七夕礼物都给你想好了
  5. AMD EPYC——CPU命名规则
  6. hive中操作struct与map三例
  7. Python中的堆实现:heapq 模块——利用堆结构实现快速访问数据流中的中位数
  8. 【渝粤教育】电大中专建筑力学作业 题库
  9. 说出来可能不信,现在酒厂都在招算法工程师
  10. 百度,在模仿和创新中成长
  11. Android Monkey Test
  12. fckeditor for php 下载,FCKeditor(HTML在线编辑器)下载_FCKeditor(HTML在线编辑器)官方下载-太平洋下载中心...
  13. 计算机专业 一级结构工程师,2018年一级结构工程师《计算机应用基础》练习题(8).doc...
  14. 小米路由器的linux命令,【原创】小米路由器开启WISP 万能中继功能
  15. 计算机换色带技巧,安装与更换针式打印机的色带的详细方法(图文教程)
  16. 洛谷P5149 会议座位
  17. 两个字符串中最长公共单词 C语言
  18. Haproxy基础知识
  19. 全排列-python递归解法
  20. 护眼灯A级和AA级有什么区别?2022双十一国AA台灯有必要

热门文章

  1. 文本编辑器添加文本编辑区
  2. 中provide的用法_英语词法:中考动词用法系统梳理下
  3. java format 补足空格_11个简单的Java性能调优技巧
  4. BUGLY集成升级空指针问题
  5. 贷款违约预测--赛题理解
  6. C++20四大之一:module特性详解
  7. c++枚举类型(二) c++11 枚举类
  8. es python demo
  9. 今日头条 文章采集_我在今日头条的成长之路—文章的排版与结构
  10. 65. Leetcode 153. 寻找旋转排序数组中的最小值 (二分查找-局部有序)