简单认识Scikit-learn

Scikit-learn是一个专门用于机器学习的Python库。它基于NumPy,SciPy和matplotlib构建,是一个简单有效的数据挖掘和数据分析工具。

官网:http://scikit-learn.org

安装Scikit-learn:

pip install -U scikit-learn 或 python -m pip install -U scikit-learn

官方开源地址:https://github.com/scikit-learn/scikit-learn

文档:http://scikit-learn.org/stable/documentation.html

User Guide:http://scikit-learn.org/stable/user_guide.html

#引入numpy和matplotlib绘图库
import numpy as np
import matplotlib as mpl
import matplotlib.pyplot as pltfrom sklearn import datasetsiris = datasets.load_iris() #加载鸢尾花数据集print(iris.keys()) #查看属性
# print(iris.DESCR) #打印文档
# print(iris.data) #查看数据4列(特征)
print(iris.data.shape) #查看矩阵形状 (150行4列)
print(iris.feature_names) #特征 sepal花萼 petal花瓣
# print(iris.target) #种类 target/label
print(iris.target.shape)
print(iris.target_names)

x = iris.data[:,:2] #取前两列
# print(x.shape) #(150,2)
#第0列作为x轴 第1列作为y轴
plt.scatter(x[:,0],x[:,1])
# plt.savefig("D:/files/PythonFiles/img/5.png",dpi=300)
plt.show()

y = iris.target
# print(y==0)

#选取特定行x轴:取出每行target==0的索引第0列 y轴:取出每行target==0的第1列 标记种类颜色
plt.scatter(x[y==0,0],x[y==0,1],color="red")
plt.scatter(x[y==1,0],x[y==1,1],color="blue")
plt.scatter(x[y==2,0],x[y==2,1],color="green")
plt.savefig("D:/files/PythonFiles/img/7.png", dpi=300)
plt.show()

#取后两列
x = iris.data[:,2:]
plt.scatter(x[y==0,0],x[y==0,1],color="red")
plt.scatter(x[y==1,0],x[y==1,1],color="blue")
plt.scatter(x[y==2,0],x[y==2,1],color="green")
plt.show()


跟着大佬梳理的流程走下来的,在这里注明一下出处:

https://github.com/Exrick/Machine-Learning
注:大佬的更直观详细

简单接触一下scikit-learn相关推荐

  1. 机器学习与Scikit Learn学习库

    摘要: 本文介绍机器学习相关的学习库Scikit Learn,包含其安装及具体识别手写体数字案例,适合机器学习初学者入门Scikit Learn. 在我科研的时候,机器学习(ML)是计算机科学领域中最 ...

  2. Scikit Learn: 在python中机器学习

    Warning 警告:有些没能理解的句子,我以自己的理解意译. 翻译自:Scikit Learn:Machine Learning in Python 作者: Fabian Pedregosa, Ga ...

  3. [转载]Scikit Learn: 在python中机器学习

    原址:http://my.oschina.net/u/175377/blog/84420 目录[-] Scikit Learn: 在python中机器学习 载入示例数据 一个改变数据集大小的示例:数码 ...

  4. 【scikit-learn】如何用Python和SciKit Learn 0.18实现神经网络

    本教程的代码和数据来自于 Springboard 的博客教程.本文的作者为 Jose Portilla,他是网络教育平台 Udemy 一门数据科学类课程的讲师. GitHub 链接:https://g ...

  5. scikit - learn 做文本分类

    文章来源: https://my.oschina.net/u/175377/blog/84420 Scikit Learn: 在python中机器学习 Warning 警告:有些没能理解的句子,我以自 ...

  6. python笔迹识别_python_基于Scikit learn库中KNN,SVM算法的笔迹识别

    之前我们用自己写KNN算法[网址]识别了MNIST手写识别数据 [数据下载地址] 这里介绍,如何运用Scikit learn库中的KNN,SVM算法进行笔迹识别. 数据说明: 数据共有785列,第一列 ...

  7. python scikit learn 关闭开源_scikit learn 里没有神经网络?

    本教程的代码和数据来自于 Springboard 的博客教程,希望能为你提供帮助.作者为 Jose Portilla,他是网络教育平台 Udemy 一门数据科学类课程的讲师. GitHub 链接:ht ...

  8. Spark技术在京东智能供应链预测的应用——按照业务进行划分,然后利用scikit learn进行单机训练并预测...

    3.3 Spark在预测核心层的应用 我们使用Spark SQL和Spark RDD相结合的方式来编写程序,对于一般的数据处理,我们使用Spark的方式与其他无异,但是对于模型训练.预测这些需要调用算 ...

  9. Query意图分析:记一次完整的机器学习过程(scikit learn library学习笔记)

    所谓学习问题,是指观察由n个样本组成的集合,并根据这些数据来预测未知数据的性质. 学习任务(一个二分类问题): 区分一个普通的互联网检索Query是否具有某个垂直领域的意图.假设现在有一个O2O领域的 ...

最新文章

  1. hibernate中持久化对象的生命周期(三态:自由态,持久态,游离态 之间的转换)...
  2. python多线程爬虫 爬取多个网页_Python 多线程抓取网页
  3. JAVA——保持cookie登录状态的HttpClient封装工具类
  4. Android 高级Drawable资源---复合Drawable----变换Drawable
  5. IOS基础之segue使用,
  6. POJ 3422 Kaka's Matrix Travels
  7. python oop_python中oop
  8. 微信小程序文本溢出省略号(···)
  9. 12条自问让你更好地编程
  10. web邮箱和客户端的区别
  11. 使用POI为Excel添加数据有效性验证
  12. oracle的临时表空间问题
  13. matlab输出pdf图片超出边框,matlab - 将Matlab Simulink模型保存为PDF,带有紧密的边界框 - 堆栈内存溢出...
  14. 抽象类中的非抽象方法调用自己的抽象方法
  15. win10用户账户控制怎么取消或打开
  16. 126篇殿堂级深度学习论文分类整理 从入门到应用
  17. java毕业设计——基于java+Jsp+Tomcat的牙科诊所管理系统设计与实现(毕业论文+程序源码)——牙科诊所管理系统
  18. 中国民航飞行学院人事薪资管理系统实践案例
  19. 利用python把dcm格式转化为jpg格式
  20. 2019中兴捧月算法大赛历程

热门文章

  1. spring三大核心学习
  2. Java for循环的几种用法
  3. Gradle与project(三)
  4. Linux网络编程 之 TCP编程(七)
  5. jQuery——parent(),parents(),offsetParent(),closets()方法
  6. 史上最全总结!Util、POJO、domain、entity、model、DAO、DTO、view、mapper、service、controller的作用和区别分析
  7. LinkedList方法源码
  8. 构造代码块、静态代码块、构造方法的执行顺序
  9. html网络,HTML—构建网络
  10. php算法在线刷题,c,算法_每日一道算法:leetcode 刷题碰到的问题。,c,算法 - phpStudy...