python:sklearn 标签编码(LabelEncoder)
参考:
https://blog.csdn.net/weixin_45875105/article/details/107818766 python sklearn 编码(one-hot,标签编码)
https://www.cnblogs.com/sench/p/10134094.html sklearn.preprocessing.LabelEncoder的使用
https://scikit-learn.org/stable/modules/generated/sklearn.preprocessing.LabelEncoder.html 官方解释
1. 准备好数据,使用LabelEncoder对数据集进行编码
- 方法1:fit、transform
enc=preprocessing.LabelEncoder() #获取一个LabelEncoder
enc=enc.fit(['小猫','小狗','兔子']) #训练LabelEncoder
data=enc.transform(data) #使用训练好的LabelEncoder对原数据进行编码
- 方法2:fit_transform
enc=preprocessing.LabelEncoder() #获取一个LabelEncoder
data=enc.fit_transform(data)
- 代码示例:
from sklearn import preprocessingdata=['小猫','小猫','小狗','小狗','兔子','兔子'] #准备好数据#方法1:
enc=preprocessing.LabelEncoder() #获取一个LabelEncoder
enc=enc.fit(['小猫','小狗','兔子']) #训练LabelEncoder
data=enc.transform(data) #使用训练好的LabelEncoder对原数据进行编码#方法2:
#enc=preprocessing.LabelEncoder() #获取一个LabelEncoder
#data=enc.fit_transform(data) print(data) #输出编码后的数据输出:[2 2 1 1 0 0]
根据结果可以看到, LabelEncoder将:小猫编码成2,小狗编码成2,兔子编码成0
2. 根据编码后的类别,反向推导出编码前对应的原始标签
方法:inverse_transform
#根据编码后的类别,反向推导出编码前对应的原始标签
print(enc.inverse_transform([0,1,2]))输出:['兔子' '小狗' '小猫']
根据输出结果可以看到,0对应兔子,1对应小狗,2对应小猫
python:sklearn 标签编码(LabelEncoder)相关推荐
- python:sklearn标签编码(LabelEncoder)
python:sklearn标签编码(LabelEncoder) sklearn.preprocessing.LabelEncoder的使用: 在训练模型之前,通常都要对数据进行一定得处理.将类别编号 ...
- python one hot编码_对python sklearn one-hot编码详解
one-hot编码的作用 使用one-hot编码,将离散特征的取值扩展到了欧式空间,离散特征的某个取值就对应欧式空间的某个点 将离散特征通过one-hot编码映射到欧式空间,是因为,在回归,分类,聚类 ...
- OneHotEncoder独热编码和 LabelEncoder标签编码——机器学习
学习sklearn和kagggle时遇到的问题,什么是独热编码?为什么要用独热编码?什么情况下可以用独热编码?以及和其他几种编码方式的区别. 首先了解机器学习中的特征类别:连续型特征和离散型特征 拿到 ...
- 独热编码(OneHotEncoder)和标签编码(LabelEncoder)
数据分类 我们在构建模型对数据进行训练之前,需要对数据进行特征工程,我们的数据可以分为连续型和离散型. 对于连续型数据,我们一般的做法是对其进行标准化或者归一化,之前写过一篇标准化和归一化的介绍,大家 ...
- python独热编码作用_关于sklearn独热编码
一.数值型类别变量 #简单来说 LabelEncoder 是对不连续的数字或者文本进行编号 from sklearn.preprocessing import LabelEncoder le = La ...
- python sklearn学习笔记大全(常见代码速查)
skleran是python中常见的机器学习包,整理下笔记.方便查询. 官方文档链接:sklearn官方英文文档 常见模型 from sklearn.linear_model import Linea ...
- python 分类变量编码_深度学习编码分类变量的3种方法——AIU人工智能学院
:数据科学.人工智能从业者的在线大学. 数据科学(Python/R/Julia) 作者 | CDA数据分析师 像Keras中的机器学习和深度学习模型一样,要求所有输入和输出变量均为数字. 这意味着,如 ...
- 机器学习之数据预处理——特征编码(标签编码,独热编码)
机器学习之数据预处理--特征编码 数据预处理--特征编码 离散数据的编码 标签编码 sklearn LabelEncoder(使用fit_transform函数) sklearn LabelEncod ...
- python+sklearn训练决策树分类模型(绘制学习曲线和验证曲线)
本文所用文件的链接 链接:https://pan.baidu.com/s/1RWNVHuXMQleOrEi5vig_bQ 提取码:p57s 关于决策树的初级应用,可以看我之前的文章: https:// ...
- python sklearn 回归案例:车流量预测
文件下载地址: 链接:https://pan.baidu.com/s/1e68J9gubRGc9WkRDPh97tQ 提取码:uxwj """回归案例 车流量预测根据已有 ...
最新文章
- BZOJ 2137 submultiple(约数,拉格朗日插值求自然数k次幂和)【BZOJ 修复工程】
- JavaScript的语言标准
- 设计模式一:设计模式遵循的原则
- 第七篇T语言实例开发,文本与程序的几种打开方法(版5.3)
- Android—TableLayout自定义表格
- linux检测远程端口是否打开
- 集群资源分配_分析下 Node.js 关于集群的那些事
- Spring学习记录(九)---通过工厂方法配置bean
- SQL Server 2008下日志清理方法
- 360互联网技术训练营第七期 -“遇见”PIKA
- 2 数据源配置_[Mybatis]-[基础支持层]-数据源信息-数据源详解
- Spring DI(依赖注入)Xml篇
- 03-17 APP自动遍历测试技术
- sqlplus下无法shutdown情况下不妨试试crsctl stop crs
- 2019-2020 中国集成电路产业人才白皮书
- 【5GC】三种SSC(Session and Service Continuity)模式介绍
- python空气质量提醒代码_空气质量指数查询示例代码
- 小程序源码:喝酒娱乐小游戏助力神器-多玩法安装简单
- Unity3D 车流线
- Office课程习题