Pandas的get_dummies

what?:get_dummies是Pandas进行独热编码(One-Hot encode)的函数


上图的左边灰色框(python debug出来的)是python执行下述代码后的结果

dummies_Embarked = pd.get_dummies(data_train['Embarked'],prefix='Embarked')

上图的右边是一个Excel 中的Embarked列,很明显:
get_dummies 函数直白的表示就是把一个属性(Embarked)中不同类别分开并用布尔值表示出来,0表示非这类。
如索引0:
Embarked_C、Embarked_Q、Embarked_S分别为:0 0 1
表示索引0属于属性Embarked中的S类

目的:常用于机器学习过程中,把一些类属性(如男的女的)转换成数值属性(0,1)便于后续特征的输入

扩展
sklearn里用OneHotEncoder

from sklearn.preprocessing import  OneHotEncoder# 将标签转换为独热编码
encoder = OneHotEncoder()
Y = encoder.fit_transform(Y.reshape(Y.shape[0], 1))
Y = Y.toarray().T
Y = Y.astype('uint8')

tensorflow的one_hot Encoder

one_hot(indices, depth, on_value=None, off_value=None, axis=None, dtype=None, name=None)

该函数的功能主要是转换成one_hot类型的张量输出。

参数功能如下:
  1)indices中的元素指示on_value的位置,不指示的地方都为off_value。indices可以是向量、矩阵。
  2)depth表示输出张量的尺寸,indices中元素默认不超过(depth-1),如果超过,输出为[0,0,···,0]
  3)on_value默认为1
  4)off_value默认为0
  5)dtype默认为tf.float32

https://www.cnblogs.com/muzidaitou/p/11262820.html

Pytorch里的one_hot Encoder

import torchtargets = torch.tensor([5, 3, 2, 1])targets_to_one_hot = torch.nn.functional.one_hot(targets)   # 默认按照targets其中的最大值+1作为one_hot编码的长度
# result:
# tensor(
# [0, 0, 0, 0, 0, 1],
# [0, 0, 0, 1, 0, 0],
# [0, 0, 1, 0, 0, 0],
# [0, 1, 0, 0, 0, 0]
#)targets_to_one_hot = torch.nn.functional.one_hot(targets, num_classes=7)  3# 指定one_hot编码长度为7
# result:
# tensor(
# [0, 0, 0, 0, 0, 1, 0],
# [0, 0, 0, 1, 0, 0, 0],
# [0, 0, 1, 0, 0, 0, 0],
# [0, 1, 0, 0, 0, 0, 0]
#)

https://blog.csdn.net/weixin_44604887/article/details/109523281

Pandas的get_dummies 实例的应用相关推荐

  1. python pandas读取excel-Python使用Pandas读写Excel实例解析

    这篇文章主要介绍了Python使用Pandas读写Excel实例解析,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下 Pandas是python的一个 ...

  2. Python之pandas:pandas的get_dummies函数简介(将分类变量转为哑变量)及其使用方法之详细攻略

    Python之pandas:pandas的get_dummies函数简介(将分类变量转为哑变量)及其使用方法之详细攻略 目录 pandas的get_dummies函数简介 pandas.get_dum ...

  3. Pandas数据分析⑥——数据分析实例(货品送达率与合格率/返修率/拒收率)

    Pandas系列目录如下: Pandas数据分析①--数据读取(CSV/TXT/JSON) Pandas数据分析②--数据清洗(重复值/缺失值/异常值) Pandas数据分析③--数据规整1(索引和列 ...

  4. pandas使用get_dummies进行one-hot编码

    官网:http://pandas.pydata.org/pandas-docs/stable/generated/pandas.get_dummies.html pandas.get_dummies( ...

  5. python 数据分析模块_Python数据分析pandas模块用法实例详解

    本文实例讲述了Python数据分析pandas模块用法.分享给大家供大家参考,具体如下: pandas pandas10分钟入门,可以查看官网:10 minutes to pandas 也可以查看更复 ...

  6. pandas 数据查询实例

    import pandas as pdfpath = "D:\\python39\\pandas\\antlearnpandasmaster\\datas\\beijing_tianqi\\ ...

  7. pandas美国人口分析实例

    美国人口分析 读取csv文件中的数据 使用merge进行数据融合 当需要级联的属性名相同时 当需要级联的属性名不同时 删除一列数据:drop 查看空数据,并根据不同情况进行相应处理 数据清洗 当空数据 ...

  8. pandas的get_dummies

    简单说一下:虚拟变量    哑变量    dummy Variable    这三个一个意思. 我总结一下我的理解:就是添加原来数据中没有的变量,但是这并不是意味着可以随意添加,应该是根据原来的数据进 ...

  9. Scikit-Learn大变化:合并Pandas

    作者 | Ted Petrou 译者 | 王天宇 编辑 | Jane 出品 | AI科技大本营 [导读]近日,Scikit-Learn 发布了 0.20 版本,这是近年来最大的一次更新.对许多数据科学 ...

最新文章

  1. 人工智能中图神经网络GNN是什么?
  2. python装饰器由浅入深_由浅入深,走进Python装饰器-----第五篇:进阶--类装饰类
  3. 用JQ去实现一个轮播效果
  4. 给定a、b两个文件,各存放50亿个url,每个url各占用64字节,内存限制是4G,如何找出a、b文件共同的url?
  5. meta name id class 标签的区别
  6. MySQL 备份与主从复制
  7. linux防火墙查看被动模式,Centos7搭建vsftpd及被动模式下的防火墙设置
  8. GIS笔记-使用Geoserver搭建MWTS服务(构建离线GIS服务)
  9. 2015 UESTC Winter Training #6【Regionals 2010 North America - Rocky Mountain】
  10. SpringSecurity系列(五) Spring Security 权限设计
  11. VB6 Socket编程
  12. 微信小程序蓝牙通讯、串口通讯、调试助手(HC-08等 )
  13. android输入法好用,安卓手机输入法哪个最好用?
  14. java实现pdf旋转_java-Apache PDFBox旋转PDImageXObject
  15. 微信订阅号推广只要这一个标题就够了!
  16. JAVA第三方工具类
  17. Excel中Chart对象成员表
  18. 想去阿里大厂去面试测试工程师?想月薪15k?这篇文章一定对你有所帮助
  19. 用python画 pareto front
  20. 自定义xml配置文件之dtd文件校验

热门文章

  1. 中职语文与计算机专业教学,中职计算机教案
  2. IDEA 安装sliksvn插件
  3. linux查看内存条pn,实验:使用GDB查看结构体在内存中的存储方式
  4. C#药店管理信息系统源码带文档
  5. Mac Python3.9 星际争霸
  6. PotPlayer播放器 莫尼卡汉化绿色版 V1.6.48089 32位
  7. 网上下载的CHM电子书无法阅读解决方法 大小没变,但右边都是空白
  8. 论文细读:DARPA Transparent Computing Program 对抗性交战1的分析结果
  9. Swift之UILabel +使用讲解+富文本+自适应高度
  10. 请求的站点不可用或无法找到怎么解决_seo优化怎么做能快速被收录