简介

  自2007年发布以来,scikit-learn已经成为Python重要的机器学习库了。scikit-learn简称sklearn,支持包括分类、回归、降维和聚类四大机器学习算法。还包含了特征提取、数据处理和模型评估三大模块。
  sklearn是Scipy的扩展,建立在NumPy和matplotlib库的基础上。利用这几大模块的优势,可以大大提高机器学习的效率。
  sklearn拥有着完善的文档,上手容易,具有着丰富的API,在学术界颇受欢迎。sklearn已经封装了大量的机器学习算法,包括LIBSVM和LIBINEAR。同时sklearn内置了大量数据集,节省了获取和整理数据集的时间。

  • 机器学习基础

  定义:针对经验E和一系列的任务T和一定表现的衡量P,如果随着经验E的积累,针对定义好的任务T可以提高表现P,就说明机器具有学习能力。

  •  sklearn安装

sklearn目前的版本是0.17.1,可以使用pip安装。在安装时需要进行包依赖检查,具体有以下几个要求:

  • Python(>=2.6 or >=3.3)
  • NumPy(>=1.6.1)
  • SciPy(>=0.9)

如果满足上述条件,就能使用pip进行安装了:

1 pip install -U scikit-learn

SaintKings-Mac-mini:nlp saintking$ pip install -U scikit-learn
Collecting scikit-learnUsing cached scikit_learn-0.19.1-cp27-cp27m-macosx_10_6_intel.macosx_10_9_intel.macosx_10_9_x86_64.macosx_10_10_intel.macosx_10_10_x86_64.whl
Installing collected packages: scikit-learn
Exception:
Traceback (most recent call last):File "/Users/saintking/Library/Python/2.7/lib/python/site-packages/pip/basecommand.py", line 215, in mainstatus = self.run(options, args)File "/Users/saintking/Library/Python/2.7/lib/python/site-packages/pip/commands/install.py", line 342, in runprefix=options.prefix_path,File "/Users/saintking/Library/Python/2.7/lib/python/site-packages/pip/req/req_set.py", line 784, in install**kwargsFile "/Users/saintking/Library/Python/2.7/lib/python/site-packages/pip/req/req_install.py", line 851, in installself.move_wheel_files(self.source_dir, root=root, prefix=prefix)File "/Users/saintking/Library/Python/2.7/lib/python/site-packages/pip/req/req_install.py", line 1064, in move_wheel_filesisolated=self.isolated,File "/Users/saintking/Library/Python/2.7/lib/python/site-packages/pip/wheel.py", line 345, in move_wheel_filesclobber(source, lib_dir, True)File "/Users/saintking/Library/Python/2.7/lib/python/site-packages/pip/wheel.py", line 316, in clobberensure_dir(destdir)File "/Users/saintking/Library/Python/2.7/lib/python/site-packages/pip/utils/__init__.py", line 83, in ensure_diros.makedirs(path)File "/System/Library/Frameworks/Python.framework/Versions/2.7/lib/python2.7/os.py", line 157, in makedirsmkdir(name, mode)
OSError: [Errno 13] Permission denied: '/Library/Python/2.7/site-packages/scikit_learn-0.19.1.dist-info'

安装方法:真机测试正常

SaintKings-Mac-mini:nlp saintking$ sudo pip install -U scikit-learn

现在采用安装Anaconda的方法.

当然,使用pip安装会比较麻烦,推荐使用Anaconda科学计算环境,里面已经内置了NumPy、SciPy、sklearn等模块,直接可用。或者使用conda进行包管理。conda安装与pip类似:

1  conda install scikit-learn

安装完sklearn以后,可以检查以下版本:

1  >>> import sklearn
2  >>> sklearn.__version__
3  '0.17.1'

转载于:https://www.cnblogs.com/kylinsblog/p/7777592.html

sklearn学习笔记之开始相关推荐

  1. SKlearn学习笔记——XGBoost

    SKlearn学习笔记--XGBoost 1. 概述 1.1 xgboost库与XGB的sklearn API 1.2 XGBoost的三大板块 2. 梯度提升树 2.1 提升集成算法:重要参数 n_ ...

  2. python sklearn学习笔记大全(常见代码速查)

    skleran是python中常见的机器学习包,整理下笔记.方便查询. 官方文档链接:sklearn官方英文文档 常见模型 from sklearn.linear_model import Linea ...

  3. sklearn学习笔记

    1.监督学习 1.1.广义线性模型 1.1.1.普通最小二乘法 class sklearn.linear_model.LinearRegression(fit_intercept=True, norm ...

  4. DataWhale sklearn学习笔记(一)

    线性回归 数据生成: 生成数据的思路是设定一个二维的函数(维度高了没办法在平面上画出来),根据这个函数生成一些离散的数据点,对每个数据点我们可以适当的加一点波动,也就是噪声,最后看看我们算法的拟合或者 ...

  5. sklearn学习笔记之简单线性回归

    简单线性回归 线性回归是数据挖掘中的基础算法之一,从某种意义上来说,在学习函数的时候已经开始接触线性回归了,只不过那时候并没有涉及到误差项.线性回归的思想其实就是解一组方程,得到回归函数,不过在出现误 ...

  6. Sklearn学习笔记3 model_selection模块

    3 Model selection and evaluation 1 sklearn.model_selection: Model Selection 1.1 Splitter Classes(分组) ...

  7. sklearn学习笔记(一)——数据预处理 sklearn.preprocessing

    python sklearn 更多 个人分类: Python 数据处理 sklearn 数据预处理 sklearn.preprocessing 查看全文 http://www.taodudu.cc/n ...

  8. sklearn学习笔记(一):数据预处理

    文章目录 1.缺失值处理 2. 数据的规范化 2.1 缩放规范化 2.1.1 最大值-最小值缩放 2.1.2 最大绝对值缩放 2.1.3 自定义缩放区间 2.2 标椎化 2.3 范数规范化 3. 非线 ...

  9. python之sklearn学习笔记

    sklearn介绍 scikit-learn是数据挖掘与分析的简单而有效的工具. 依赖于NumPy, SciPy和matplotlib. 它主要包含以下几部分内容: 从功能来分: classifica ...

  10. sklearn学习笔记3:降维算法

    sklearn中降维算法都被包括在模块decomposition中,这个模块本质是一个矩阵分解模块 PCA使用的信息量衡量指标,就是样本方差,又称可解释性方差,方差越大,特征所带信息量就越多 PCA与 ...

最新文章

  1. Postman获取App端接口
  2. SQL Server2008存储结构之聚集索引
  3. tornado post第3方_[33]python-Web-框架-Tornado
  4. P4570 [BJWC2011]元素
  5. Spring入门(二)之下载与安装
  6. 2058. 找出临界点之间的最小和最大距离
  7. C#关键字的个人理解与注释
  8. 数学家的亿万商业王国:创建“验证码”和“多邻国”,20岁就被盖茨挖去微软...
  9. python画图为什么运行不出来_PyCharm中Matplotlib绘图不能显示UI效果的问题解决
  10. 蓝桥杯 ALGO-104 算法训练 阿尔法乘积
  11. HDU 1789 Doing Homework again(贪心)
  12. HINSTANCE HANDLE HWND 的区别及一般方法
  13. 我的CSDN博客下载器,下载博客文章保存为mht文件
  14. 宝马android系统升级,宝马史上最大规模软件升级,换新OS7系统和安卓Auto,您的换了吗...
  15. 百度推广技巧:如何提高网站点击率?
  16. mysql column specified twice_Column 'box_id' specified twice 错误
  17. 深信服 VDS设备烤机
  18. pyttsx3 语音包安装、使用详解
  19. auth认证相关 --token 深入了解
  20. 面相,暴露你的生活质量

热门文章

  1. MAC编译freetype
  2. 开培训会没人来,是正常的
  3. 查看dll是32还是64
  4. JAVA命令行运行时设置参数
  5. 管理感悟:绝不容忍有问题没行动
  6. 他对我有成见,怎么办
  7. python set集合转numpy.array
  8. 鼠标被计算机无法识别怎么办,win7系统usb鼠标无法识别怎么解决 电脑usb鼠标无法识别解决方法...
  9. java关键字与解释_5.Java基础知识-注释和关键字
  10. 什么是 POD 数据类型