机器学习sklearn | sklearn简介
机器学习sklearn | sklearn简介
- 1. 简介
- 2. 特点
- 3. 安装
- 3.1 注意事项
- 4. 机器学习要做的事
- 5. 机器学习问题的分类
- 6. 数据集
- 7. 加载sklearn自带的数据集
1. 简介
scikit-learn是基于Python语言的机器学习库
2. 特点
- 简单高效的数据分析工具
- 可在多种环境中重复使用
- 建立在Numpy,Scipy以及matplotlib等数据科学库之上
- 开源且可商用的-基于BSD许可
3. 安装
- pip方法:
pip install -U scikit-learn
- conda方法:
conda install scikit-learn
3.1 注意事项
升级或卸载使用 Anaconda 安装的 scikit-learn,不应该使用 pip 命令!
应该用:
升级 scikit-learn:
conda update scikit-learn
卸载 scikit-learn:
conda remove scikit-learn
使用 pip install -U scikit-learn 升级 或 pip uninstall scikit-learn 卸载 可能无法正确删除 conda 命令安装的文件
pip 升级和卸载操作仅适用于通过 pip install 安装的软件包
4. 机器学习要做的事
一般来说,机器学习就是用 n 个 样本数据训练模型,然后尝试预测未知数据的属性
如果每个样本是多个属性的数据 (比如说是一个多维记录),就说它有许多“属性”,或称 features(特征)
5. 机器学习问题的分类
我们可以将学习问题分为两大类:
- 监督学习
- 无监督学习
监督学习
其中数据带有一个附加属性,即我们想要预测的结果值,这个问题可以是:
分类 :
样本属于两个或更多个类,我们想从已经标记的数据中学习如何预测未标记数据的类别。 分类问题的一个示例是手写数字识别,其目的是将每个输入向量分配给有限数目的离散类别之一。 我们通常把分类视作监督学习的一个离散形式(区别于连续形式),从有限的类别中,给每个样本贴上正确的标签。
回归 :
如果期望的输出由一个或多个连续变量组成,则该任务称为 回归 。 回归问题的一个示例是预测鲑鱼的长度是其年龄和体重的函数。
无监督学习
其中训练数据由没有任何相应目标值的一组输入向量x组成。这种问题的目标可能是在数据中发现彼此类似的示例所聚成的组,这种问题称为 聚类 , 或者,确定输入空间内的数据分布,称为 密度估计 ,又或从高维数据投影数据空间缩小到二维或三维以进行 可视化
6. 数据集
数据集可分为:
- 训练集
- 测试集
机器学习是从数据的属性中学习,并将它们应用到新数据的过程。 这就是为什么机器学习中评估算法的普遍实践是把数据分割成 训练集 (我们从中学习数据的属性)和 测试集 (我们测试这些性质)
7. 加载sklearn自带的数据集
cikit-learn 提供了一些标准数据集,例如 用于分类的 iris 和 digits 数据集 和 波士顿房价回归数据集
from sklearn import datasetsiris = datasets.load_iris()
digits = datasets.load_digits()
机器学习sklearn | sklearn简介相关推荐
- Sklearn 损失函数如何应用到_菜鸟学机器学习,Sklearn库主要模块功能简介
导读 作为一名数据分析师,当我初次接触数据分析三剑客(numpy.pandas.matplotlib)时,感觉每个库的功能都很多很杂,所以在差不多理清了各模块功能后便相继推出了各自教程(文末附链接): ...
- 菜鸟学机器学习,Sklearn库主要模块功能简介
导读 作为一名数据分析师,当我初次接触数据分析三剑客(numpy.pandas.matplotlib)时,感觉每个库的功能都很多很杂,所以在差不多理清了各模块功能后便相继推出了各自教程(文末附链接): ...
- Python sklearn机器学习各种评价指标——Sklearn.metrics简介及应用示例
Python Sklearn.metrics 简介及应用示例 利用Python进行各种机器学习算法的实现时,经常会用到sklearn(scikit-learn)这个模块/库. 无论利用机器学习算法进行 ...
- python 机器学习_基于 Python 语言的机器学习工具Sklearn
本篇介绍了Sklearn机器学习基础,从Sklearn的简介,模块以及与tensorflow的优劣势对比来了解基于Python语言的机器学习工具. 01.Sklearn简介 sklearn(sc ...
- 机器学习之sklearn使用下载MNIST数据集进行分类识别
机器学习之sklearn使用下载MNIST数据集进行分类识别 一.MNIST数据集 1.MNIST数据集简介 2.获取MNIST数据集 二.训练一个二分类器 1.随机梯度下降(SGD)分类器 2.分类 ...
- python的metrics_Python Sklearn.metrics 简介及应用示例
Python Sklearn.metrics 简介及应用示例 利用Python进行各种机器学习算法的实现时,经常会用到sklearn(scikit-learn)这个模块/库. 无论利用机器学习算法进行 ...
- 机器学习之sklearn基础教程!
↑↑↑关注后"星标"Datawhale 每日干货 & 每月组队学习,不错过 Datawhale干货 作者:李祖贤,深圳大学,Datawhale高校群成员 本次分享是基于sc ...
- 数据挖掘原理与算法:机器学习->{[sklearn. model_selection. train_test_split]、[h2o]、[网格搜索]、[numpy]、[plotly.express]}
数据挖掘原理与算法:机器学习->{[sklearn. model_selection. train_test_split].[h2o].[网格搜索].[numpy].[plotly.expres ...
- ML之ME/LF:基于不同机器学习框架(sklearn/TF)下算法的模型评估指标(损失函数)代码实现及其函数(Scoring/metrics)代码实现(仅代码)
ML之ME/LF:基于不同机器学习框架(sklearn/TF)下算法的模型评估指标(损失函数)代码实现及其函数(Scoring/metrics)代码实现(仅代码) 目录 单个评价指标各种框架下实现 1 ...
最新文章
- 看完GitHub官方的2021年度报告,才发现原来全球程序员好像都在卷呐
- 几道有意思的逻辑分析题
- Python批量剪裁图片
- 《Linux菜鸟入门》Linux网络管理
- [Linux] Vmware 15安装CentOs后显示网络不可用
- nfs mysql_heatbeat-gui实现基于nfs的mysql高可用集群
- Light OJ 1406 Assassin`s Creed 减少国家DP+支撑点甚至通缩+最小路径覆盖
- linux内核那些事之buddy(慢速申请内存__alloc_pages_slowpath)(5)
- 网易游戏回应裁员 10%;字节跳动秘密研发手机;iOS 13 beta 5 发布 | 极客头条
- IDM6.38使用教程 ——下载加速 百度云下载加速 捕获网页视频,音乐
- win10配置计算机时强制关机,win10系统强制关机后开不了机了的解决方案
- Linux修改文件保存时报错E45: 已设定选项 ‘readonly‘ (请加 ! 强制执行)
- 镜头超声波马达的工作原理
- 为什么总是封板又打开涨停_一旦持有个股出现涨停板,却封不住反复打开,意味着什么?...
- Ingress session sticky
- 记一次重大的生产事故
- 3、SYN-SENT
- 移动端(手机端)页面自适应解决方案—rem布局篇 1
- 从流水线工人,到谷歌上班的程序媛,一位湖南娄底妹子的励志故事...
- 基于51单片机将红外避障模块(E18-D80NK)与led联动
热门文章
- .mdf数据库恢复mysql_sql server 如何通过mdf文件和ldf文件恢复数据库
- Rust原子类型和内存排序
- intel power gadget mac_苹果电脑真的那么耐用吗?我拿五年前的 Mac 试了试。
- Beyond Compare代码对比工具
- 五、数据编码:曼侧斯特编码,差分曼彻斯特编码的区别 , 4B/5B编码 ——网络工程师成长之路
- 自监督学习与半监督学习
- 万字长文概述单目3D目标检测算法
- 关于iPad的100个问题
- Python如何启动windows本地程序
- shmget物理内存_linux下共享内存mmap()方法和shmget()方法的疑问?