1️⃣、转换器

想一下之前做的特征工程的步骤?

  • 1 实例化 (实例化的是一个转换器类(Transformer))
  • 2 调用fit_transform(对于文档建立分类词频矩阵,不能同时调用)

我们把特征工程的接口称之为转换器,其中转换器调用有这么几种形式

  • fit_transform
  • fit
  • transform
    • 实例化一个转换器
transfer = StandardScaler()
  • 传入数据,进行转换
data = transfer.fit_transform(data)
from sklearn.preprocessing import StandardScaler
transfer = StandardScaler()
a = [[1,2,3],[4,5,6]]
transfer.fit_transform(a)
transfer.fit(a)  # 先计算均值,标准差
transfer.transform(a)  # 转换把均值,标准差保存在transfer中
b = [[7, 8, 9], [10, 11, 12]]
transfer.transform(b)  # 打印出来的结果还是按照 a 的均值标准差的形式。
transfer.fit_transform(b)  # 用fit_transform就生成了自己的均值、标准差,来进行运算

2️⃣、估计器

在sklearn中,估计器(estimator)是一个重要的角色,是一类实现了算法的API

  • sklearn 估计器是进行机器学习的面向对象

  • 1 用于分类的估计器:

    • sklearn.neighbors k-近邻算法
    • sklearn.naive_bayes 贝叶斯
    • sklearn.linear_model.LogisticRegression 逻辑回归
    • sklearn.tree 决策树与随机森林
  • 2 用于回归的估计器:

    • sklearn.linear_model.LinearRegression 线性回归
    • sklearn.linear_model.Ridge 岭回归
  • 3 用于无监督学习的估计器

    • sklearn.cluster.KMeans 聚类

1、估计器的流程,步骤

​ ①、实例化一个估计器

 estimator = KNeighborsClassifier()

​ ②、传入训练数据集,进行机器训练

 estimator.fit(x_train, y_train)

​ ③、模型评估

方法1:

   y_predict = estimator.predict(x_test)y_predict==y_test

​ 方法2:计算模型准确率

   estimator.score(x_test,y_test)

机器学习之转换器和估计器相关推荐

  1. 【机器学习】分类算法-sklearn转换器和估计器

    目标 知道sklearn的转换器和估计器流程 转换器 想一下之前做的特征工程的步骤? 实例化 (实例化的是一个转换器类(Transformer)) 调用fit_transform(对于文档建立分类词频 ...

  2. python人工智能——机器学习——转换器与估计器

    转换器 1.实例化 (实例化的是一个转换器类(Transformer)) 2.调用fit_transform(对于文档建立分类词频矩阵,不能同时调用) 估计器 sklearn机器学习算法的实现-估计器 ...

  3. 机器学习-转换器与估计器05

    转换器 # -*- coding: utf-8 -*- from sklearn.preprocessing import StandardScalers = StandardScaler()s1 = ...

  4. 用Spark机器学习数据流水线进行广告检测

    在这篇文章中,我们Spark的其它机器学习API,名为Spark ML,如果要用数据流水线来开发大数据应用程序的话,这个是推荐的解决方案.关键点: 了解机器学习数据流水线有关内容. 怎么用Apache ...

  5. python教学视频下载-Python机器学习入门教程全套视频下载【传智播客】

    Python机器学习入门教程 初级共3天课 本套教程是机器学习的入门课程,主要介绍一些经典的传统机器学习算法,如分类算法:KNN算法,朴素贝叶斯算法,逻辑回归,决策树算法以及随机森林;回归算法:线性回 ...

  6. 机器学习算法基础——机器学习概述

    20.数据的划分和介绍 数据集划分 机器学习一般的数据集会划分为两个部分: 训练数据:用于训练,构建模型 测试数据:在模型检验时使用,用于评估模型是否有效 sklearn数据集划分API sklear ...

  7. 【机器学习】Python机器学习的神器- Scikit-learn使用说明

    全文共 26745 字,106 幅图表, 预计阅读时间 67 分钟. 0 引言 Sklearn (全称 Scikit-Learn) 是基于 Python 语言的机器学习工具.它建立在 NumPy, S ...

  8. 【机器学习基础】Python机器学习的神器- Scikit-learn使用说明

    全文共 26745 字,106 幅图表, 预计阅读时间 67 分钟. 0 引言 Sklearn (全称 Scikit-Learn) 是基于 Python 语言的机器学习工具.它建立在 NumPy, S ...

  9. 【机器学习】快速入门机器学习

    机器学习概述 特征工程 特征工程是指从原始数据转换为特征向量的过程.特征工程是机器学习中最重要的起始步骤,会直接影响机器学习的效果,并通常需要大量的时间.典型的特征工程包括数据清理.特征提取.特征选择 ...

最新文章

  1. python怎么定义空矩阵_python 空矩阵
  2. Leetcode 347. 前K个高频元素 解题思路及C++实现
  3. you-get 一个下载视频的好工具
  4. SAP S/4HANA使用ABAP获得生产订单的状态 1
  5. 201671030107胡文艳实验三作业互评与改进报告
  6. Unity中Time.deltaTime的含义及其应用
  7. java记录登陆时间_Spring security如何实现记录用户登录时间功能
  8. 分割字符串,字符串去除空格
  9. 21年计算机网络原理综合测评,(年对口升学计算机综合测评卷.doc
  10. 美国国家标准技术局发布应用容器安全指南
  11. 微博中微服务缓存_微服务实践分享(5)缓存中心
  12. Pytorch搭建DenseNet
  13. vba中split用法
  14. SAS入门 (二)--宏
  15. reviewboard mysql_Ubuntu下ReviewBoard安装全过程_MySQL
  16. maven环境变量的配置与idea中的配置
  17. 【英语四六级-必背单词】高中英语单词 (H)-MP3试听与下载
  18. 解决Eth0网卡不存在的情况_wuli大世界_新浪博客
  19. honor magicbook 16pro
  20. 不同tab页sessionStorage共享情况

热门文章

  1. 哪个星座的心肠最硬?
  2. xfs文件系统操作实践
  3. UE4 Cinecamera焦距、视野、感应器尺寸之间的数学关系
  4. 基础知识(一),ip地址详解、网关、DNS、进制转换、DOS命令、批处理、用户和组管理、telnet、RDP、NTFS、CIFS
  5. 解决谷歌浏览器打开空白标签页自动跳转https://www.google.com.hk/webhp?ie=UTF-8gws_rd=crrct=j
  6. 12 条实用的 zypper 命令范例
  7. 流媒体之从零实现搭建简单流媒体服务器,推流,拉流播放全景视频
  8. mpdf php7,mPDF永远不会在Ubuntu / Apache / PHP7堆栈上呈现
  9. Unity Shader 做一个简单的波浪 屏幕扭曲
  10. python爬虫实例之爬取智联招聘数据