一下子看完这个网址不用跳跳跳点点点系列

通常来说, 机器学习的方法包括:

监督学习 supervised learning;

非监督学习 unsupervised learning;

半监督学习 semi-supervised learning;

那我们为什么要选择Sklearn呢?

Scikit learn 也简称 sklearn, 是机器学习领域当中最知名的 python 模块之一.

Sklearn 包含了很多种机器学习的方式:

Classification 分类

Regression 回归

Clustering 非监督分类

Dimensionality reduction 数据降维

Model Selection 模型选择

Preprocessing 数据预处理

安装Sklearn吧

最简单的方法就是使用pip

打开命令窗口输入:pip3 install-Uscikit-learn

注:我电脑为win64,已安装python3、numpy等。

在兴奋的码代码之前,首先要选择你需要的算法!

算法分为分类,回归,聚类,降维四类。

监督——分类和回归

非监督——聚类

除此之外,还需要考虑数据集的大小。例如当数据量<50时,就需要增加数据量。

首先尝试一下分类器的使用!KNN classifier!

目的:根据花的属性将花分类。

基本思路:选择几个临近点,综合它们做个平均来作为预测值。

好像跟matlab有异曲同工之妙。。。

接下来我们来看看Sklearn强大的数据库 data sets。

好像跟前面差不多~~

当然我们也可以自己生成虚拟数据:

高级使用

数据标准化

在进行数据标准化之前,我们首先要搞清楚什么是数据标准化?为什么要进行数据标准化?由于参加过数学建模比赛的同学应该知道,没参加过的请自行百度。总之不要看了别人跟你展示正确率提高了之后,将“提升准确率”作为说服你进行数据标准化的理由。

检验神经网络

我们如何检验一个网络的正确率从而改进网络呢?

第一种方法:之前提到的“训练组与测试组”。

就像考试结束我们来对照正确答案给个分数~

第二种方法:误差曲线。

说白了就是误差的可视化。跌宕起伏的曲线肯定不好。

误差曲线的反面是准确度曲线,其实就是跟误差曲线互补。

第三种方法:正规化——解决Overfitting问题。

第四种方法:交叉验证——确定哪样的参数能够更有效的解决现有的问题

后面的就不写了,交叉验证什么的,只起到了了解的作用。

后记:下次一定用markdown

sklearn matlab,机器学习-Sklearn相关推荐

  1. 机器学习-Sklearn

    Scikit learn 也简称 sklearn, 是机器学习领域当中最知名的 python 模块之一. Sklearn 包含了很多种机器学习的方式:Classification 分类 Regress ...

  2. Py之scikit-learn:机器学习Sklearn库的简介、安装、使用方法(ML算法如何选择)、代码实现之详细攻略

    Py之scikit-learn:机器学习Sklearn库的简介.安装.使用方法.代码实现之详细攻略 目录 scikit-learn的简介 scikit-learn的安装 scikit-learn的使用 ...

  3. svd降维 python案例_菜菜的机器学习sklearn实战-----sklearn中的降维算法PCA和SVD

    菜菜的机器学习sklearn实战-----sklearn中的降维算法PCA和SVD 概述 从什么叫维度说开来 简单讲,shape中返回了几个数字就是几维. 一张表最多就是一维 当一个数组中存在2张3行 ...

  4. [机器学习-Sklearn]函数sklearn.feature_extraction.DictVectorizer理解与总结

    机器学习-Sklearn之DictVectorizer函数学习 函数介绍 例子1 例子2 - 文件中读数据 函数介绍 sklearn.featture_extraction.DictVectorize ...

  5. python机器学习-sklearn挖掘乳腺癌细胞(五)

    python机器学习-sklearn挖掘乳腺癌细胞( 博主亲自录制) 网易云观看地址 https://study.163.com/course/introduction.htm?courseId=10 ...

  6. 《菜菜的机器学习sklearn课堂》学习笔记 + 课件

    <菜菜的机器学习sklearn课堂> sklearn入门与决策树 随机森林应用泛化误差调参实例 数据预处理和特征工程 降维算法PCA和SVD 逻辑回归 聚类算法Kmeans SVM支持向量 ...

  7. 《菜菜的机器学习sklearn课堂》聚类算法Kmeans

    聚类算法 聚类算法 无监督学习与聚类算法 sklearn中的聚类算法 KMeans KMeans是如何工作的 簇内误差平方和的定义和解惑 sklearn.cluster.KMeans 重要参数 n_c ...

  8. 《菜菜的机器学习sklearn课堂》逻辑回归

    逻辑回归 概述:名为"回归"的分类器 为什么需要逻辑回归? sklearn中的逻辑回归 linear_model.LogisticRegression 二元逻辑回归的损失函数 损失 ...

  9. 《菜菜的机器学习sklearn课堂》sklearn入门与决策树

    决策树 sklearn简介 决策树 - 概述 决策树是如何工作的 sklearn中的决策树 分类树 DecisionTreeClassifier 重要参数 criterion 建立一颗树(只有一个参数 ...

最新文章

  1. mysql 转pxc_PXC 配置笔记-从MySQL直接转成PXC集群
  2. 图灵七月书讯【Cassandra权威指南将在7月末上市】
  3. CentOS6.3配置yum源
  4. 计算机网络的硬件连接图,路由器设置图和网络电缆连接图_计算机硬件和网络_IT /计算机_数据...
  5. matlab充分利用性能,Matlab高性能编程——代码优化和并行计算
  6. java 雅思_基于JAVA的雅思考试管理系统的设计与实现(SSH,MySQL)(含录像)
  7. mysql非必现数据插不进去_MySQL必知必会:数据插入(Insert)
  8. mysql排序规则选什么区别_mysql – 字符集和排序规则是什么意思?
  9. sql convert 转换时间格式
  10. “威金(Worm.Viking)”病毒特点-专杀及_desktop.ini删除
  11. icem二维非结构网格划分_【史上最全轴承结构化网格划分系列】第五弹——自动校准滚针轴承(文末附模型领取方式)...
  12. 千行百业如何正确上BI?不仅要数据,更要生态 | 创新场景50
  13. Linux 下安装 Wordpress教程
  14. 干货《周志华机器学习详细公式推导版》发布,南瓜书pumpkin-book
  15. JFS与JFS2的区别
  16. The GPG keys listed for the “MySQL 5.7 Community Server“ repository are alread__一蓑烟雨任平生
  17. linux上不了网有两个网卡,linux上两个常见的网卡报错
  18. 思科配置交换机console密码、全局密码、远程登入(telnet)密码
  19. ps整体替换单一颜色
  20. 推荐一款基于微信小程序的共享雨伞租借系统

热门文章

  1. ES集群中出现UNASSIGNED分片时的解决思路
  2. HDU--1219AC me
  3. 最小生成树 Kruskal算法
  4. 今天聊聊系统又崩溃了~~~
  5. mac 修改dhcp服务器,Mac电脑如何设置DHCP
  6. win7旗舰版64位安装SQL2000无响应
  7. jenkins sonar
  8. 常用的adb shell命令记录
  9. Android如何成功导入外部项目
  10. Dtree目录树的总结