参考:

https://blog.csdn.net/weixin_45875105/article/details/107818766  python sklearn 编码(one-hot,标签编码)

https://www.cnblogs.com/sench/p/10134094.html  sklearn.preprocessing.LabelEncoder的使用

https://scikit-learn.org/stable/modules/generated/sklearn.preprocessing.LabelEncoder.html  官方解释

1. 准备好数据,使用LabelEncoder对数据集进行编码

  • 方法1:fit、transform

enc=preprocessing.LabelEncoder()   #获取一个LabelEncoder
        enc=enc.fit(['小猫','小狗','兔子'])         #训练LabelEncoder
        data=enc.transform(data)                  #使用训练好的LabelEncoder对原数据进行编码

  • 方法2:fit_transform

enc=preprocessing.LabelEncoder()   #获取一个LabelEncoder
        data=enc.fit_transform(data)

  • 代码示例:
from sklearn import preprocessingdata=['小猫','小猫','小狗','小狗','兔子','兔子']  #准备好数据#方法1:
enc=preprocessing.LabelEncoder()   #获取一个LabelEncoder
enc=enc.fit(['小猫','小狗','兔子'])  #训练LabelEncoder
data=enc.transform(data)       #使用训练好的LabelEncoder对原数据进行编码#方法2:
#enc=preprocessing.LabelEncoder()   #获取一个LabelEncoder
#data=enc.fit_transform(data) print(data)    #输出编码后的数据输出:[2 2 1 1 0 0]

根据结果可以看到, LabelEncoder将:小猫编码成2,小狗编码成2,兔子编码成0

2. 根据编码后的类别,反向推导出编码前对应的原始标签

方法:inverse_transform

#根据编码后的类别,反向推导出编码前对应的原始标签
print(enc.inverse_transform([0,1,2]))输出:['兔子' '小狗' '小猫']

根据输出结果可以看到,0对应兔子,1对应小狗,2对应小猫

python:sklearn 标签编码(LabelEncoder)相关推荐

  1. python:sklearn标签编码(LabelEncoder)

    python:sklearn标签编码(LabelEncoder) sklearn.preprocessing.LabelEncoder的使用: 在训练模型之前,通常都要对数据进行一定得处理.将类别编号 ...

  2. python one hot编码_对python sklearn one-hot编码详解

    one-hot编码的作用 使用one-hot编码,将离散特征的取值扩展到了欧式空间,离散特征的某个取值就对应欧式空间的某个点 将离散特征通过one-hot编码映射到欧式空间,是因为,在回归,分类,聚类 ...

  3. OneHotEncoder独热编码和 LabelEncoder标签编码——机器学习

    学习sklearn和kagggle时遇到的问题,什么是独热编码?为什么要用独热编码?什么情况下可以用独热编码?以及和其他几种编码方式的区别. 首先了解机器学习中的特征类别:连续型特征和离散型特征 拿到 ...

  4. 独热编码(OneHotEncoder)和标签编码(LabelEncoder)

    数据分类 我们在构建模型对数据进行训练之前,需要对数据进行特征工程,我们的数据可以分为连续型和离散型. 对于连续型数据,我们一般的做法是对其进行标准化或者归一化,之前写过一篇标准化和归一化的介绍,大家 ...

  5. python独热编码作用_关于sklearn独热编码

    一.数值型类别变量 #简单来说 LabelEncoder 是对不连续的数字或者文本进行编号 from sklearn.preprocessing import LabelEncoder le = La ...

  6. python sklearn学习笔记大全(常见代码速查)

    skleran是python中常见的机器学习包,整理下笔记.方便查询. 官方文档链接:sklearn官方英文文档 常见模型 from sklearn.linear_model import Linea ...

  7. python 分类变量编码_深度学习编码分类变量的3种方法——AIU人工智能学院

    :数据科学.人工智能从业者的在线大学. 数据科学(Python/R/Julia) 作者 | CDA数据分析师 像Keras中的机器学习和深度学习模型一样,要求所有输入和输出变量均为数字. 这意味着,如 ...

  8. 机器学习之数据预处理——特征编码(标签编码,独热编码)

    机器学习之数据预处理--特征编码 数据预处理--特征编码 离散数据的编码 标签编码 sklearn LabelEncoder(使用fit_transform函数) sklearn LabelEncod ...

  9. python+sklearn训练决策树分类模型(绘制学习曲线和验证曲线)

    本文所用文件的链接 链接:https://pan.baidu.com/s/1RWNVHuXMQleOrEi5vig_bQ 提取码:p57s 关于决策树的初级应用,可以看我之前的文章: https:// ...

  10. python sklearn 回归案例:车流量预测

    文件下载地址: 链接:https://pan.baidu.com/s/1e68J9gubRGc9WkRDPh97tQ 提取码:uxwj """回归案例 车流量预测根据已有 ...

最新文章

  1. BZOJ 2137 submultiple(约数,拉格朗日插值求自然数k次幂和)【BZOJ 修复工程】
  2. JavaScript的语言标准
  3. 设计模式一:设计模式遵循的原则
  4. 第七篇T语言实例开发,文本与程序的几种打开方法(版5.3)
  5. Android—TableLayout自定义表格
  6. linux检测远程端口是否打开
  7. 集群资源分配_分析下 Node.js 关于集群的那些事
  8. Spring学习记录(九)---通过工厂方法配置bean
  9. SQL Server 2008下日志清理方法
  10. 360互联网技术训练营第七期 -“遇见”PIKA
  11. 2 数据源配置_[Mybatis]-[基础支持层]-数据源信息-数据源详解
  12. Spring DI(依赖注入)Xml篇
  13. 03-17 APP自动遍历测试技术
  14. sqlplus下无法shutdown情况下不妨试试crsctl stop crs
  15. 2019-2020 中国集成电路产业人才白皮书
  16. 【5GC】三种SSC(Session and Service Continuity)模式介绍
  17. python空气质量提醒代码_空气质量指数查询示例代码
  18. 小程序源码:喝酒娱乐小游戏助力神器-多玩法安装简单
  19. Unity3D 车流线
  20. Office课程习题

热门文章

  1. 神经网络drop out
  2. ubuntu的文件路径
  3. 181220每日一句
  4. Atitit 查询优化器的流程attilax总结
  5. Atitit js版本es5 es6新特性
  6. Atitit.ide代码块折叠插件 eclipse
  7. atitit.表格的绑定client side 最佳实践
  8. Atitit.现实生活中最好使用的排序方法-----ati排序法总结
  9. 能力的变迁:能力包括哪些方面
  10. 兴业证券:主动偏股型基金评价体系