sklearn学习笔记之开始
简介
自2007年发布以来,scikit-learn已经成为Python重要的机器学习库了。scikit-learn简称sklearn,支持包括分类、回归、降维和聚类四大机器学习算法。还包含了特征提取、数据处理和模型评估三大模块。
sklearn是Scipy的扩展,建立在NumPy和matplotlib库的基础上。利用这几大模块的优势,可以大大提高机器学习的效率。
sklearn拥有着完善的文档,上手容易,具有着丰富的API,在学术界颇受欢迎。sklearn已经封装了大量的机器学习算法,包括LIBSVM和LIBINEAR。同时sklearn内置了大量数据集,节省了获取和整理数据集的时间。
- 机器学习基础
定义:针对经验E和一系列的任务T和一定表现的衡量P,如果随着经验E的积累,针对定义好的任务T可以提高表现P,就说明机器具有学习能力。
- sklearn安装
sklearn目前的版本是0.17.1,可以使用pip安装。在安装时需要进行包依赖检查,具体有以下几个要求:
- Python(>=2.6 or >=3.3)
- NumPy(>=1.6.1)
- SciPy(>=0.9)
如果满足上述条件,就能使用pip进行安装了:
1 pip install -U scikit-learn
SaintKings-Mac-mini:nlp saintking$ pip install -U scikit-learn Collecting scikit-learnUsing cached scikit_learn-0.19.1-cp27-cp27m-macosx_10_6_intel.macosx_10_9_intel.macosx_10_9_x86_64.macosx_10_10_intel.macosx_10_10_x86_64.whl Installing collected packages: scikit-learn Exception: Traceback (most recent call last):File "/Users/saintking/Library/Python/2.7/lib/python/site-packages/pip/basecommand.py", line 215, in mainstatus = self.run(options, args)File "/Users/saintking/Library/Python/2.7/lib/python/site-packages/pip/commands/install.py", line 342, in runprefix=options.prefix_path,File "/Users/saintking/Library/Python/2.7/lib/python/site-packages/pip/req/req_set.py", line 784, in install**kwargsFile "/Users/saintking/Library/Python/2.7/lib/python/site-packages/pip/req/req_install.py", line 851, in installself.move_wheel_files(self.source_dir, root=root, prefix=prefix)File "/Users/saintking/Library/Python/2.7/lib/python/site-packages/pip/req/req_install.py", line 1064, in move_wheel_filesisolated=self.isolated,File "/Users/saintking/Library/Python/2.7/lib/python/site-packages/pip/wheel.py", line 345, in move_wheel_filesclobber(source, lib_dir, True)File "/Users/saintking/Library/Python/2.7/lib/python/site-packages/pip/wheel.py", line 316, in clobberensure_dir(destdir)File "/Users/saintking/Library/Python/2.7/lib/python/site-packages/pip/utils/__init__.py", line 83, in ensure_diros.makedirs(path)File "/System/Library/Frameworks/Python.framework/Versions/2.7/lib/python2.7/os.py", line 157, in makedirsmkdir(name, mode) OSError: [Errno 13] Permission denied: '/Library/Python/2.7/site-packages/scikit_learn-0.19.1.dist-info'
安装方法:真机测试正常
SaintKings-Mac-mini:nlp saintking$ sudo pip install -U scikit-learn
现在采用安装Anaconda的方法.
当然,使用pip安装会比较麻烦,推荐使用Anaconda科学计算环境,里面已经内置了NumPy、SciPy、sklearn等模块,直接可用。或者使用conda进行包管理。conda安装与pip类似:
1 conda install scikit-learn
安装完sklearn以后,可以检查以下版本:
1 >>> import sklearn 2 >>> sklearn.__version__ 3 '0.17.1'
转载于:https://www.cnblogs.com/kylinsblog/p/7777592.html
sklearn学习笔记之开始相关推荐
- SKlearn学习笔记——XGBoost
SKlearn学习笔记--XGBoost 1. 概述 1.1 xgboost库与XGB的sklearn API 1.2 XGBoost的三大板块 2. 梯度提升树 2.1 提升集成算法:重要参数 n_ ...
- python sklearn学习笔记大全(常见代码速查)
skleran是python中常见的机器学习包,整理下笔记.方便查询. 官方文档链接:sklearn官方英文文档 常见模型 from sklearn.linear_model import Linea ...
- sklearn学习笔记
1.监督学习 1.1.广义线性模型 1.1.1.普通最小二乘法 class sklearn.linear_model.LinearRegression(fit_intercept=True, norm ...
- DataWhale sklearn学习笔记(一)
线性回归 数据生成: 生成数据的思路是设定一个二维的函数(维度高了没办法在平面上画出来),根据这个函数生成一些离散的数据点,对每个数据点我们可以适当的加一点波动,也就是噪声,最后看看我们算法的拟合或者 ...
- sklearn学习笔记之简单线性回归
简单线性回归 线性回归是数据挖掘中的基础算法之一,从某种意义上来说,在学习函数的时候已经开始接触线性回归了,只不过那时候并没有涉及到误差项.线性回归的思想其实就是解一组方程,得到回归函数,不过在出现误 ...
- Sklearn学习笔记3 model_selection模块
3 Model selection and evaluation 1 sklearn.model_selection: Model Selection 1.1 Splitter Classes(分组) ...
- sklearn学习笔记(一)——数据预处理 sklearn.preprocessing
python sklearn 更多 个人分类: Python 数据处理 sklearn 数据预处理 sklearn.preprocessing 查看全文 http://www.taodudu.cc/n ...
- sklearn学习笔记(一):数据预处理
文章目录 1.缺失值处理 2. 数据的规范化 2.1 缩放规范化 2.1.1 最大值-最小值缩放 2.1.2 最大绝对值缩放 2.1.3 自定义缩放区间 2.2 标椎化 2.3 范数规范化 3. 非线 ...
- python之sklearn学习笔记
sklearn介绍 scikit-learn是数据挖掘与分析的简单而有效的工具. 依赖于NumPy, SciPy和matplotlib. 它主要包含以下几部分内容: 从功能来分: classifica ...
- sklearn学习笔记3:降维算法
sklearn中降维算法都被包括在模块decomposition中,这个模块本质是一个矩阵分解模块 PCA使用的信息量衡量指标,就是样本方差,又称可解释性方差,方差越大,特征所带信息量就越多 PCA与 ...
最新文章
- Postman获取App端接口
- SQL Server2008存储结构之聚集索引
- tornado post第3方_[33]python-Web-框架-Tornado
- P4570 [BJWC2011]元素
- Spring入门(二)之下载与安装
- 2058. 找出临界点之间的最小和最大距离
- C#关键字的个人理解与注释
- 数学家的亿万商业王国:创建“验证码”和“多邻国”,20岁就被盖茨挖去微软...
- python画图为什么运行不出来_PyCharm中Matplotlib绘图不能显示UI效果的问题解决
- 蓝桥杯 ALGO-104 算法训练 阿尔法乘积
- HDU 1789 Doing Homework again(贪心)
- HINSTANCE HANDLE HWND 的区别及一般方法
- 我的CSDN博客下载器,下载博客文章保存为mht文件
- 宝马android系统升级,宝马史上最大规模软件升级,换新OS7系统和安卓Auto,您的换了吗...
- 百度推广技巧:如何提高网站点击率?
- mysql column specified twice_Column 'box_id' specified twice 错误
- 深信服 VDS设备烤机
- pyttsx3 语音包安装、使用详解
- auth认证相关 --token 深入了解
- 面相,暴露你的生活质量