机器学习之转换器和估计器
1️⃣、转换器
想一下之前做的特征工程的步骤?
- 1 实例化 (实例化的是一个转换器类(Transformer))
- 2 调用fit_transform(对于文档建立分类词频矩阵,不能同时调用)
我们把特征工程的接口称之为转换器,其中转换器调用有这么几种形式
- fit_transform
- fit
- transform
- 实例化一个转换器
transfer = StandardScaler()
- 传入数据,进行转换
data = transfer.fit_transform(data)
from sklearn.preprocessing import StandardScaler
transfer = StandardScaler()
a = [[1,2,3],[4,5,6]]
transfer.fit_transform(a)
transfer.fit(a) # 先计算均值,标准差
transfer.transform(a) # 转换把均值,标准差保存在transfer中
b = [[7, 8, 9], [10, 11, 12]]
transfer.transform(b) # 打印出来的结果还是按照 a 的均值标准差的形式。
transfer.fit_transform(b) # 用fit_transform就生成了自己的均值、标准差,来进行运算
2️⃣、估计器
在sklearn中,估计器(estimator)是一个重要的角色,是一类实现了算法的API
sklearn 估计器是进行机器学习的面向对象
1 用于分类的估计器:
- sklearn.neighbors k-近邻算法
- sklearn.naive_bayes 贝叶斯
- sklearn.linear_model.LogisticRegression 逻辑回归
- sklearn.tree 决策树与随机森林
2 用于回归的估计器:
- sklearn.linear_model.LinearRegression 线性回归
- sklearn.linear_model.Ridge 岭回归
3 用于无监督学习的估计器
- sklearn.cluster.KMeans 聚类
1、估计器的流程,步骤
①、实例化一个估计器
estimator = KNeighborsClassifier()
②、传入训练数据集,进行机器训练
estimator.fit(x_train, y_train)
③、模型评估
方法1:
y_predict = estimator.predict(x_test)y_predict==y_test
方法2:计算模型准确率
estimator.score(x_test,y_test)
机器学习之转换器和估计器相关推荐
- 【机器学习】分类算法-sklearn转换器和估计器
目标 知道sklearn的转换器和估计器流程 转换器 想一下之前做的特征工程的步骤? 实例化 (实例化的是一个转换器类(Transformer)) 调用fit_transform(对于文档建立分类词频 ...
- python人工智能——机器学习——转换器与估计器
转换器 1.实例化 (实例化的是一个转换器类(Transformer)) 2.调用fit_transform(对于文档建立分类词频矩阵,不能同时调用) 估计器 sklearn机器学习算法的实现-估计器 ...
- 机器学习-转换器与估计器05
转换器 # -*- coding: utf-8 -*- from sklearn.preprocessing import StandardScalers = StandardScaler()s1 = ...
- 用Spark机器学习数据流水线进行广告检测
在这篇文章中,我们Spark的其它机器学习API,名为Spark ML,如果要用数据流水线来开发大数据应用程序的话,这个是推荐的解决方案.关键点: 了解机器学习数据流水线有关内容. 怎么用Apache ...
- python教学视频下载-Python机器学习入门教程全套视频下载【传智播客】
Python机器学习入门教程 初级共3天课 本套教程是机器学习的入门课程,主要介绍一些经典的传统机器学习算法,如分类算法:KNN算法,朴素贝叶斯算法,逻辑回归,决策树算法以及随机森林;回归算法:线性回 ...
- 机器学习算法基础——机器学习概述
20.数据的划分和介绍 数据集划分 机器学习一般的数据集会划分为两个部分: 训练数据:用于训练,构建模型 测试数据:在模型检验时使用,用于评估模型是否有效 sklearn数据集划分API sklear ...
- 【机器学习】Python机器学习的神器- Scikit-learn使用说明
全文共 26745 字,106 幅图表, 预计阅读时间 67 分钟. 0 引言 Sklearn (全称 Scikit-Learn) 是基于 Python 语言的机器学习工具.它建立在 NumPy, S ...
- 【机器学习基础】Python机器学习的神器- Scikit-learn使用说明
全文共 26745 字,106 幅图表, 预计阅读时间 67 分钟. 0 引言 Sklearn (全称 Scikit-Learn) 是基于 Python 语言的机器学习工具.它建立在 NumPy, S ...
- 【机器学习】快速入门机器学习
机器学习概述 特征工程 特征工程是指从原始数据转换为特征向量的过程.特征工程是机器学习中最重要的起始步骤,会直接影响机器学习的效果,并通常需要大量的时间.典型的特征工程包括数据清理.特征提取.特征选择 ...
最新文章
- python怎么定义空矩阵_python 空矩阵
- Leetcode 347. 前K个高频元素 解题思路及C++实现
- you-get 一个下载视频的好工具
- SAP S/4HANA使用ABAP获得生产订单的状态 1
- 201671030107胡文艳实验三作业互评与改进报告
- Unity中Time.deltaTime的含义及其应用
- java记录登陆时间_Spring security如何实现记录用户登录时间功能
- 分割字符串,字符串去除空格
- 21年计算机网络原理综合测评,(年对口升学计算机综合测评卷.doc
- 美国国家标准技术局发布应用容器安全指南
- 微博中微服务缓存_微服务实践分享(5)缓存中心
- Pytorch搭建DenseNet
- vba中split用法
- SAS入门 (二)--宏
- reviewboard mysql_Ubuntu下ReviewBoard安装全过程_MySQL
- maven环境变量的配置与idea中的配置
- 【英语四六级-必背单词】高中英语单词 (H)-MP3试听与下载
- 解决Eth0网卡不存在的情况_wuli大世界_新浪博客
- honor magicbook 16pro
- 不同tab页sessionStorage共享情况
热门文章
- 哪个星座的心肠最硬?
- xfs文件系统操作实践
- UE4 Cinecamera焦距、视野、感应器尺寸之间的数学关系
- 基础知识(一),ip地址详解、网关、DNS、进制转换、DOS命令、批处理、用户和组管理、telnet、RDP、NTFS、CIFS
- 解决谷歌浏览器打开空白标签页自动跳转https://www.google.com.hk/webhp?ie=UTF-8gws_rd=crrct=j
- 12 条实用的 zypper 命令范例
- 流媒体之从零实现搭建简单流媒体服务器,推流,拉流播放全景视频
- mpdf php7,mPDF永远不会在Ubuntu / Apache / PHP7堆栈上呈现
- Unity Shader 做一个简单的波浪 屏幕扭曲
- python爬虫实例之爬取智联招聘数据