2016年十大Python机器学习开源项目

1、Scikit-learn 用于数据挖掘和数据分析的简单而有效的工具,基于NumPy,SciPy和matplotlib,开源,商业可用的BSD许可证。

Commits: 21486, Contributors: 736, Github地址: Scikit-learn

2、Tensorflow  最初由Google机器智能研究机构的Google Brain小组的研究人员和工程师开发。 该系统旨在促进机器学习的研究,并使其快速和容易地从研究原型过渡到生产系统。

Commits: 10466, Contributors: 493, Github地址: Tensorflow

3、Theano  允许您有效地定义,优化和评估涉及多维数组的数学表达式。

Commits: 24108, Contributors: 263, Github URL: Theano

4、Caffe is一个深入学习的框架,速度快和模块化。 它由伯克利视觉和学习中心(BVLC)和社区贡献者开发。

Commits: 3801, Contributors: 215, Github URL: Caffe

5、Gensim is 一个免费的Python库,具有诸如可扩展的统计语义之类的特性,分析用于语义结构的纯文本文档,从语义上检索类似的文档。

Commits: 2702, Contributors: 145, Github URL: Gensim

6、Pylearn2 是一个机器学习库。 它的大部分功能是建立在Theano的基础之上。 这意味着您可以使用数学表达式编写Pylearn2插件(新模型,算法等),Theano将为您优化和稳定这些表达式,并将其编译为您选择的后端(CPU或GPU)。

Commits: 7100, Contributors: 115, Github URL: Pylearn2

7、Statsmodels 是一个Python模块,允许用户探索数据,估计统计模型和执行统计测试。 描述性统计,统计测试,绘图函数和结果统计的详细列表可用于不同类型的数据和每个估计器。

Commits: 8664, Contributors: 108, Github URL: Statsmodels

8、Shogun是机器学习工具箱,提供广泛的统一和高效的机器学习(ML)方法。 工具箱无缝地允许容易地组合多个数据表示,算法类和通用工具。

Commits: 15172  Contributors: 105, Github URL: Shogun

9、Chainer 一个用于深度学习模型的基于Python的独立开源框架。 Chainer提供灵活,直观和高性能的方法来实现全范围的深度学习模型,包括最先进的模型,如复现神经网络和变分自动编码器。

Commits: 6298, Contributors: 84, Github URL: Chainer

10、NuPIC 是基于称为分层时间存储器(HTM)的新皮层理论的开源项目。 HTM理论的一部分已经在应用中实现,测试和使用,并且HTM理论的其他部分仍在开发中。

Commits: 6088, Contributors: 76, Github URL: NuPIC

11、Neon是Nervana的基于Python的深度学习库。 它提供易用性,同时提供最高的性能。

Commits: 875, Contributors: 47, Github URL: Neon

12、Nilearn 一个Python模块,用于在NeuroImaging数据上快速轻松地进行统计学习。 它利用scikit-learn Python工具箱来处理多变量统计信息,包括预测建模,分类,解码或连接分析。

Commits: 5254, Contributors: 46, Github URL: Nilearn

13、Orange3是开源机器学习和数据可视化的新手和专家。 具有大型工具箱的交互式数据分析工作流程。

Commits: 6356, Contributors: 40, Github URL: Orange3

14、Pymc 一个实现贝叶斯统计模型和拟合算法的python模块,包括马尔可夫链蒙特卡罗。 其灵活性和可扩展性使其适用于大量问题。

Commits: 2701, Contributors: 37, Github URL: Pymc

15、PyBrain is 一个用于Python的模块化机器学习库。 它的目标是为机器学习任务提供灵活,易于使用但仍然强大的算法,以及各种预定义环境,以测试和比较您的算法。

Commits: 984, Contributors: 31, Github URL: PyBrain

16、Fuel 是一个数据管道框架,为您的机器学习模型提供他们需要的数据。 它计划被Blocks 和Pylearn2神经网络库使用。

Commits: 1053, Contributors: 29, Github URL: Fuel

17、PyMVPA 是一个Python包,旨在简化大型数据集的统计学习分析。 它提供了一个可扩展的框架,具有用于分类,回归,特征选择,数据导入和导出的广泛算法的高级接口。

Commits: 9258, Contributors: 26, Github URL: PyMVPA

18、Annoy (Approximate Nearest Neighbors Oh Yeah)是一个C ++库,使用Python绑定来搜索靠近给定查询点的空间中的点。 它还创建大型只读的基于文件的数据结构,这些数据结构被映射到内存中,以便许多进程可以共享相同的数据。

Commits: 365, Contributors: 24, Github URL: Annoy

19、Deap 一个用于快速原型和测试思想的新型进化计算框架。 它试图使算法显式和数据结构透明。 它与并行机制(例如多处理和SCOOP)完美协调。

Commits: 1854, Contributors: 21, Github URL: Deap

20、Pattern 是Python编程语言的Web挖掘模块。 它捆绑了数据挖掘工具(Google + Twitter +维基百科API,网络爬虫,HTML DOM解析器),自然语言处理(词性标记,n元语法搜索,情感分析,WordNet),机器学习 ,k-means聚类,朴素贝叶斯+ k-NN + SVM分类器)和网络分析(图形中心性和可视化)。

Commits: 943, Contributors: 20  , Github URL: Pattern

python机器学习开源代码_2016 年十大 Python 机器学习开源项目相关推荐

  1. python常用代码入门-入门十大Python机器学习算法(附代码)

    入门十大Python机器学习算法(附代码) 今天,给大家推荐最常用的10种机器学习算法,它们几乎可以用在所有的数据问题上: 1.线性回归 线性回归通常用于根据连续变量估计实际数值(房价.呼叫次数.总销 ...

  2. python调用库有哪些_十大Python机器学习常用库 python开发,你用过几个?

    1.Pipenv Pipenv 是 Kenneth Reitz 的业余项目,旨在将其他软件包(例如 npm 和 yarn)整合到 Python 里.它不需要安装 virtualenv, virtual ...

  3. python扩展库用于科学计算的有哪些_数据科学必备的十大 Python 库

    ​Python 已成为当今使用最广泛的编程语言之一,尤其是在数据科学领域. Python 是一种高性能的语言,易于学习和调试,并且具有广泛的库支持.这些库都有自己独特的功能,一些专注于数据挖掘,一些专 ...

  4. 11月14日云栖精选夜读 | 动画+原理+代码,解读十大经典排序算法

    排序算法是<数据结构与算法>中最基本的算法之一. 排序算法可以分为内部排序和外部排序,内部排序是数据记录在内存中进行排序,而外部排序是因排序的数据很大,一次不能容纳全部的排序记录,在排序过 ...

  5. 常用的十大Python开发工具

    据权威机构统计,Python人才需求量每日高达5000+,但目前市场上会 Python 的程序员少之又少, 竞争小,很容易快速高薪就业.可能你并不太了解常用的十大Python开发工具都有哪些,现在告诉 ...

  6. 推荐 Python 十大经典练手项目,让你的 Python 技能点全亮!

    前言:如果有人问:"Python还火吗?""当然,很火.""哪能火多久呢?""不知道." 技术发展到现在衍生出许多种编程 ...

  7. 推荐Python十大经典练手项目,让你的Python技能点全亮!

    前言:如果有人问:"Python还火吗?""当然,很火.""哪能火多久呢?""不知道." 技术发展到现在衍生出许多种编程 ...

  8. python上海培训哪里比较好-上海十大python培训机构

    上海Python培训班 千锋教育打造人工智能Python工程师 快速咨询 上海十大python培训机构 很多零基础的同学选择学习Python入门.到底该怎么选择Python培训机构?应该去哪里学习Py ...

  9. 图解十大经典机器学习算法入门

    弱人工智能近几年取得了重大突破,悄然间,已经成为每个人生活中必不可少的一部分.以我们的智能手机为例,看看到底温藏着多少人工智能的神奇魔术. 下图是一部典型的智能手机上安装的一些常见应用程序,可能很多人 ...

最新文章

  1. 登录linux后台工具,linux后台进程管理工具-supervisor
  2. java创建datetime_Java OffsetDateTime ofInstant()用法及代码示例
  3. Day24--Part2-伪Ajax(iframe)
  4. 基于Foursquare, 我们还能做什么 ?
  5. 全球及中国便携式卧式空压机行业前景动态与投资趋势分析报告2022版
  6. 零样本性能超越GPT-3!谷歌提出1370亿参数自回归语言模型
  7. linux 关闭防火墙firewall,centos中关闭防火墙(firewall)及SELinux
  8. 最后一块石头的重量II
  9. linux查看openssh和openssl版本
  10. 如何正确的在一个循环中删除ArrayList中的元素。
  11. IllegalArgumentException:argument type mismatch
  12. Android基础知识:在UI线程中运行代码
  13. SQL Server性能调优--优化建议(二)
  14. Dos系统功能的调用
  15. 3D帧间匹配-----剔除动态障碍物
  16. Crashing Robots
  17. HTML与CSS3的知识整理
  18. CDH安装服务和下载parcels包
  19. 2018年度总结(人若无名,专心练剑)
  20. [Acwing] 58周赛 4489. 最长子序列

热门文章

  1. Bat批处理命令使用教程(完整篇)
  2. 这些b站课程 ,看完即巅峰
  3. 混沌映射X(n+1) = r * Xn(1-Xn),给出python的画图代码,感兴趣可以跑一下。混沌科普请看https://www.bilibili.com/video/av86292156/
  4. srt编辑的文件在linux显示乱码,修改.srt格式字幕文件
  5. node.js爬虫-校园网模拟登录
  6. oracle pdf response,AWR报告分析之二:ges inquiry response 过高
  7. python基础语法实验目的_Python基础语法
  8. NLP常见语言模型及数据增强方法总结
  9. rp官方提供的打包开发版文件系统的方式
  10. 广州的11个辖区_广东省广州市有哪些区?