本文作者Matthew May是一位正在进行并行式机器学习算法研究的计算机硕士研究生,同时Matthew也是一位数据挖掘研习者,数据发烧友,热忱的机器学习科学家。开源工具在数据科学工作流中起到了愈发重要的作用。Github十大深度学习项目,其中包含了大量的代码库,框架以及学习资料。看看Github上的人们都在使用哪些工具,都在从哪些资源那里进行学习。

最新KDnuggets软件调查结果表明,在过去12个月,73%的数据科学家都会使用免费的数据科学工具。不言而喻,Python和R语言(两者皆为开源)以及各自的生态系统,是这些免费的数据科学工具中,数据科学家们运用的最突出、最必不可少的。

Github已成为名副其实的开源软件交流中心,其上寄存了几乎所有想得到的项目类型。深度学习在学术、研究和兴趣方面的普及程度越来越高,并在数据科学方面越来越重要,我们将探索一下Github里出类拔萃的深度学习项目。

需要注意的是,大部分人认为属于深度学习的一些重要项目并没有出现在该名单上,原因在于在Github搜索「深度学习」时并没有涉及到这些项目。

1. Caffe

Caffe是利用Python和MATLAB两者结合创建的深度学习程序库。由伯克利大学的伯克利视觉与学习中心创办,如果人们仅把Caffe当做计算机视觉应用是情有可原的;事实上,这是一个通用的深度学习程序库,能够开发卷积网络,并创建其他视觉、语音等应用。

2. Data Science IPython Notebooks

这是由Donne Martin策划收集的IPython笔记本。话题涵盖大数据、Hadoop、scikit-learn和科学Python堆栈以及很多其他方面的内容。至于深度学习,像是TensorFlow、Theano和Caffe之类的框架也均被涵盖其中,当然还有相关的特定构架和概念等。

3. ConvNetJS

由斯坦福博士生Andrej Karpathy写就,他也一直维持着博客更新。ConvNetJS是一个由Javascript实现的神经网络及其通用模块,并且包括大量的基于浏览器的实例。这些文档和实例数不胜数,且非常完整。不要让javascript和神经网络结合在一起的想法把你吓跑了,这可是个非常受欢迎而且非常有用的项目。

4. Keras

Keras也是一种Python深度学习程序库,但它利用了TensorFlow和Theano,这也意味着它可以在目前已知最受欢迎的2个深度学习研发库中的任一个上运行。也是那些越来越多的被形容为非常高级的库之一,而所有这些高等级库都非常相似:抽象化底层的深度学习引擎,使使用者可以更快、更便捷以及更灵活地部署神经网络。Keras支持主流深度学习架构,自带30秒的快速入门指南,并有着完善的文档。

5. MXNet

作为一个深度学习框架,MXNet旨在灵活和高效,并且通过允许混合使用指令式编程及符号式编程的技巧来提高代码生产力。这个项目可以和多种语言绑定,如Python, R, 以及 Julia。同时MXNet还附带了一系列神经网络指南和蓝本。另外值得注意的是,一个相关项目用JavaScript在浏览器环境中实现MXNet,有兴趣的朋友可以通过 该链接 对一个图形分类模型进行测试。

6. Qix

这是一个各种计算和编程主题有关资源(包括Node.Js, GoLang和深度学习)的Github版本库。之所以说「似乎(appears)」,是因为Github版本库都是用中文写的,谷歌提供的翻译甚至会带来更多不解。不过,有许多链接,所以如果你能说中文或看得懂中文,或许这里有些有价值的东西。

7. Deeplearning4j

Deeplearning4j是为Java 和Scala打造的一款具有工业强度的深度学习框架。作为唯一值得研究的JVM深度学习解决方案之一,它在这个领域有着明显的优势。不仅可以很好地与Hadoop 以及Spark的结合,它还可以使用GPU。他的文档和指南也非常可靠。

8. Machine Learning Tutorials

这是一张机器学习和深度学习教程,文章和资源的名单。这张列表根据通过主题进行组织,包括了许多与深度学习有关的类别,包括计算机视觉,加强学习以及各种架构。由于内容广泛,几个月来,已经在社交媒体上小有名气,你也可以 点击此处 做些贡献。

9. DeepLearnToolbox

DeepLeanToolBox是一个供MATLAB和Octave使用的深度学习工具箱。很遗憾,这个项目现在已被废弃并停止维护。其Github版本库也指向了在修习深度学习方面颇具价值的其他选择:Theano和TensorFlow。

如果说这个已经废弃的云端版本库还有点什么价值,那就是 这个链接 了, 这本由Yoshua Bengio撰写的教程被包含在了这个版本库中以作为学习人工智能所使用的深度学习架构的学习资源。

10. LISA Lab Deep Learning Tutorials

这个Github版本库汇总了加拿大蒙特利尔大学的LISA实验室深度学习课程的练习材料。其介绍文档摘取如下:

这套练习材料将介绍你们了解一些最重要的深度学习算法,以及展示如何使用Theano运行这些算法。

Theano是一个使撰写深度学习模型变得简单,并允许用户选择GPU对他们进行训练的python库。

点击 这里 在线查看课程材料原文链接

本文永久更新链接地址:http://www.linuxidc.com/Linux/2016-01/127621.htm

看看数据科学家们都在用什么:Github上的十大深度学习项目相关推荐

  1. 避坑指南:数据科学家新手常犯的13个错误(附工具、学习资源链接)

    作者:Pranav  Dar 翻译:和中华 校对:张玲 本文约6000字,建议阅读10+分钟. 本文是老司机给数据科学家新手的一些建议,希望每个致力于成为数据科学家的人少走弯路. 简介 你已经决定把数 ...

  2. 大数据谋定农业发展路径-丰收节贸易会:全球十大经典案例

    大数据谋定农业发展路径-丰收节贸易会:全球十大经典案例 新闻中国采编网 中国新闻采编网 谋定研究中国智库网 经信研究 国研智库 国情讲坛 哲商对话 万权采编:"基于物联网等技术的应用,农业领 ...

  3. 新一代大数据任务调度 - Apache DolphinScheduler喜提十大开源新锐项目 最具人气项目

    经 10000+ 开发者公开票选,20+专家评审. 10+ 主编团打分,历经数月打磨,11 月 19 日,由InfoQ 发起并组织的[2020中国技术力量年度榜单评选]结果正式揭晓. 2020 年度十 ...

  4. 大数据早报:Firebase推出机器学习功能 英伟达大幅扩大深度学习学院规模(11.2)

    数据早知道,上乐投网看早报! 『机器学习』闹哪样? Firebase推出机器学习功能! 谷歌旗下的公司昨日在Amsterdam的Firebase Dev Summit峰会上宣布:Firebase将会有 ...

  5. ImageNet验证集6%的标签都是错的,MIT:十大常用数据集没那么靠谱

    作者|张倩.小舟 来源|机器之心 把老虎标成猴子,把青蛙标成猫,把码头标成纸巾--MIT.Amazon 的一项研究表明,ImageNet 等十个主流机器学习数据集的测试集平均错误率高达 3.4%. 我 ...

  6. Java9都快发布了,Java8的十大新特性你了解多少呢?

    Java 9预计将于今年9月份发布,这是否会是一次里程碑式的版本,我们拭目以待.今天,我们先来复习一下2014年发布的Java 8的十大新特性. Java 8可谓是自Java 5以来最具革命性的版本了 ...

  7. 掰一掰GitHub上优秀的大数据项目

    VMware CEO Pat Gelsinger曾说:   数据科学是未来,大数据分析则是打开未来之门的钥匙 企业正在迅速用新技术武装自己以便从大数据项目中获益.各行业对大数据分析人才的需求也迫使我们 ...

  8. 深度学习项目一: keras实现歌词的自动生成 (含数据和所需源码)

    数据集下载:点我下载数据集 我们实现的是歌词的自动生成. 主要看我在代码中的注释..注释的很详细,不懂可以留言. 1:我们加载所需要的模块,这里的模块都是比较常用的模块 from keras.mode ...

  9. 计算机专业的书普遍都这么贵,Github上的计算机电子书很多~~~

    Github上编程书资源很多,你可以根据类型和语言去搜索.推荐几个热门的: free-programming-books-zh_CN:58K 星的GitHub,编程语言.WEB.函数.大数据.操作系统 ...

最新文章

  1. 嵌入式系统开发过程中遇到的——volatile
  2. 正则表达式处理的基本步骤
  3. Linux中的MySql数据库远程连接
  4. SqlSessionFactoryBuilder、SqlSessionFactory、SqlSession作用域(Scope)和生命周期
  5. 如何在DNN模块中插入一个图片--在模块中引用资源文件
  6. TCP三次握手、tcp和udp对比、四表五链
  7. 6-14 数据库高级
  8. html控制图的宽,用JointJS做一个简单的功能控制图
  9. NSX产品许可介绍( 适用于vSphere 6.2.x,6.3.x和6.4.x的VMware NSX的产品产品(2145269))
  10. linux下无权限安装ffmpeg-4.1.3
  11. python维度切片中三个是怎么取值的_总结python 多维切片之冒号和三个点的使用方法...
  12. Scala下载及安装(Windows)以及Idea中Scala项目的创建
  13. World从任意页开始设置页码详细教程
  14. IT 相关常见英文缩写一览
  15. OGRE里,MAYA模型导出MESH格式模型方法
  16. python 求特征值特征向量 numpy.linalg.eig()
  17. 【英语语法-谓语时态】
  18. 干电池电量采集_干电池电量检测方法
  19. 华为WATCH GT3正式开售,健康监测和运动管理我全都要
  20. python实现翻转直角三角形

热门文章

  1. C++引入名字空间(namespace)意义何在?为什么using namespace std会成为常用语句?
  2. 整活插件 炉石传说_炉石传说:一顿操作猛如虎,定睛一看原地杵,会长整活被死人抬走...
  3. 儿童机器人慧昱科教获6000万元A轮融资,海尔资本领投
  4. 区块链金融应用论坛关于量化的分享
  5. JVM调优总结(2):一些概念(下)
  6. Nginx如何反向代理网站和设置虚拟主机
  7. [Android编程心得]Debug的一些技巧
  8. 嵌入式EasyHMI V0.1版终于推出,C#真是软件开发的利器
  9. 字段定义_两大高招逐浪CMS中定义省地市县三级字段显示方式
  10. thinkphp日志泄漏漏洞_ThinkPHP框架通杀所有版本的一个SQL注入漏洞详细分析及测试方法...