快速理解
独热编码前,存在1列x3行的数据:
1列的列名称为: 动物名称
3行中第1行的值为:      猫
3行中第2行的值为:      狗
3行中第3行的值为:      猫
独热编码后,变为2列x3行的数据,第一列是猫,第二列是狗
2列的列名称分别为:猫,狗
3行中第1行的值变为:1,0
3行中第2行的值变为:0,1
3行中第3行的值变为:1,0

选择题
以下关于pandas库中pd.get_dummies()函数说法错误的是:
选项:
A 可以对Dataframe中字段类型是Object的列进行独热编码
B 可以对Dataframe中字段类型是数值型的列进行独热编码
C 一般会使特征的维度数增加
D 在数据预处理阶段可能会用到该函数

问题解析
1.pd.get_dummies()函数:是pandas库中实现独热编码的函数,请看上述快速理解的例子,独热编码的主要思想是将一个分类变量多种取值(A、B、C……)的列,替换多个列(列名为:A、B、C……),每一行的值从原来的A、B、C……变换为0或者1,因为计算机更擅长处理0或1;
2.A,B选项,pd.get_dummies()函数会将Dataframe中字段类型是Object的列独热编码,而字段类型是数值型的列不进行独热编码。pd.get_dummies()函数主要是对具有离散特征的数据进行独热编码,而具有连续类型的数据不进行独热编码,age列和name列的字段类型分别为float64和Object,见图1,所以age列没有进行独热编码,name进行了独热编码,见图2;
3.C选项,独热编码会将一个多值(A、B、C……)的列,替换为多列(列名为:A、B、C……),所以一般会使特征的维度数增加。
4.D选项,数据预处理包括数据清洗、数据集成、数据变换和数据规约四个步骤,独热编码是在数据变换阶段采取的一种方法,所以在数据预处理阶段可能会用到该函数。

答案
本题正确答案为:B

温馨期待
期待大家提出宝贵建议,互相交流,收获更大,助教:qmy

迎大家转发,一起传播知识和正能量,帮助到更多人。期待大家提出宝贵改进建议,互相交流,收获更大。辛苦大家转发时注明出处(也是咱们公益编程交流群的入口网址),刘经纬老师共享知识相关文件下载地址为:http://liujingwei.cn

[Python中pandas实现独热编码][pd.get_dummies()函数]相关推荐

  1. Python中pandas库实现数据缺失值判断isnull()函数

    [小白从小学Python.C.Java] [Python全国计算机等级考试] [Python数据分析考试必会题] ● 标题与摘要 Python中pandas库实现数据缺失值判断 isnull()函数 ...

  2. 机器学习中使用的独热编码

    什么是独热编码? 独热编码(One-Hot Encoding)是一种常用的特征编码方法,主要用于将离散特征转换为连续特征,以便机器学习算法能够更好地处理.独热编码将每个离散特征的取值映射为一个二进制向 ...

  3. python实现数据编码(独热编码+归一化)

    实现功能: python实现数据编码,对离散型变量进行独热编码,对数值型变量进行归一化处理. 实现代码: import numpy as np import pandas as pddef Read_ ...

  4. 人口普查数据集独热编码转换

    人口普查数据集独热编码转换 描述 在机器学习中,数据的表示方式对于模型算法的性能影响很大,寻找数据最佳表示的过程被称为"特征工程",在实际应用中许多特征并非连续的数值,比如国籍.学 ...

  5. 【小代码讲解】独热编码(One-Hot编码)

    独热编码(One-Hot编码) 独热编码介绍 独热编码表示 独热编码实现 使用sklearn 不使用sklearn 独热编码介绍 在机器学习中,标签的处理总是需要进行独热编码的处理,因为独热编码有以下 ...

  6. python pandas 独热编码

    python pandas 独热编码 import pandas as pd df1 = pd.DataFrame({'姓名': ['周', '武', '郑'],'成绩': [100, 96, 77] ...

  7. 独热编码python实现_详解深度学习中的独热编码

    很多人开始接触深度学习,数据处理遇到第一个专业英文术语就是one-hot encode(独热编码),很多初学者就会迷茫,这个东西是什么意思,其实说的直白点所谓的独热编码最重要的就是把一组字符串或者数字 ...

  8. Python下数值型与字符型类别变量独热编码(One-hot Encoding)实现

    1 OneHotEncoder 2 pd.get_dummies   在数据处理与分析领域,数值型与字符型类别变量的编码是不可或缺的预处理操作.本文基于Python下OneHotEncoder与pd. ...

  9. Python实现独热编码

    关于独热编码与哑变量编码的概念,可以参考:https://blog.csdn.net/qq_41853758/article/details/81252174. 离散特征的编码分为两种情况: 1.离散 ...

最新文章

  1. MLPerf发布首个AI芯片推理测试排行榜:阿里平头哥含光800获得多项第一
  2. redis缓存的安装和使用
  3. spring security源码分析心得
  4. kwvcprojparser不是内部_在盗版window xp上安装的visual studio 2010学习版编译ace6.1时出现如下问题...
  5. 第五章functions.py中的交叉熵代码解释
  6. selenium自动化测试_Selenium测试可实现有效的测试自动化
  7. 设计模式 之 建造者
  8. 极速收藏!巨详细的分布式架构知识体系
  9. 分享一个入门级实操项目,思路非常棒!
  10. ssm注解配置连接mysql_基于注解和配置类的SSM(Spring+SpringMVC+Mybatis)项目详细配置...
  11. DnsFookup:一款功能强大的DNS重绑定工具
  12. STM32电机库(ST-MC-Workbench)学习记录——电流采样参数设置
  13. 如何快速把英语单词导入有道词典
  14. 雨流计数法的matlab实现,采用三点法与四点法
  15. C++计算某天是该年的第几天
  16. 【Excel】取消隐藏没反应
  17. 记某众测存储型xss漏洞小tips
  18. 阿里巴巴国际站首页地址怎复制链接店铺PC自己外贸平台装修链接我的全球旺铺装修全屏代码装修设置复制链接
  19. C语言位运算-实现Photoshop反向功能
  20. Android Studio设置关闭当前页面的快捷键ctrl+w

热门文章

  1. CouchDB操作手册
  2. 为什么别人总是把你往“坏处想”?浅谈如何更好地与项目团队中的“网友”更好地交流
  3. WINCC 报警语音播报
  4. 名编辑电子杂志大师教程 | 设置目录
  5. 计算输入的正数和负数个数
  6. FilterConfig 的作用
  7. 垃圾邮件、欺骗和网络钓鱼,如何防止电子邮件安全意识的威胁
  8. 30天自制操作系统 (一个操作系统的实现)
  9. PCTA考试经验分享
  10. 取消IE8打开HTTPS带图片内容后提示安全警告