get_dummies

是利用pandas实现one hot encode的方式

机器学习之One-Hot Encoding详解 - 简书 (jianshu.com)https://www.jianshu.com/p/cb344e1c860a

one hot encode 独热编码,又称一位有效编码,其方法是使用N位状态寄存器来对N个状态进行编码,每个状态都有它独立的寄存器位,并且在任意时候,其中只有一位有效。

pandas.get_dummies(data, prefix=None, prefix_sep='_', dummy_na=False, columns=None, sparse=False, drop_first=False)
import pandas as pd
df = pd.DataFrame([  ['green' , 'A'],   ['red'   , 'B'],   ['blue'  , 'A']])  df.columns = ['color',  'class']
pd.get_dummies(df) 

每个类别的值都进行0-1编码

上述执行完以后再打印df 出来的还是get_dummies 前的图,因为你没有写

df = pd.get_dummies(df)

可以对指定列进行get_dummies

pd.get_dummies(df.color)

也可以将指定列进行get_dummies 后合并到元数据中

df = df.join(pd.get_dummies(df.color))

将指定列进行get_dummies 后合并到元数据中
df = df.join(pd.get_dummies(df.color))


import osos.makedirs(os.path.join('..', 'data'), exist_ok=True)
data_file = os.path.join('..', 'data', 'house_tiny.csv')
with open(data_file, 'w') as f:f.write('NumRooms,Alley,Price\n')  # 列名f.write('NA,Pave,127500\n')  # 每行表示一个数据样本f.write('2,NA,106000\n')f.write('4,NA,178100\n')f.write('NA,NA,140000\n')import pandas as pd
data = pd.read_csv(data_file)
print(data)input , output = data.iloc[:, 0:2], data.iloc[:, 2]
input = input.fillna(input.mean())
print(input)

【机器学习】pd.get_dummies()相关推荐

  1. pd.get_dummies

    get_dummies 是利用pandas实现one hot encode的方式.详细参数请查看官方文档 官方文档在这里 pandas.get_dummies(data, prefix=None, p ...

  2. pd.get_dummies()

    get_dummies 是利用pandas实现one hot encode的方式 pandas.get_dummies(data, prefix=None, prefix_sep='_', dummy ...

  3. pandas 下的 one hot encoder 及 pd.get_dummies() 与 sklearn.preprocessing 下的 OneHotEncoder 的区别

    sklearn.preprocessing 下除了提供 OneHotEncoder 还提供 LabelEncoder(简单地将 categorical labels 转换为不同的数字): 1. 简单区 ...

  4. [Python中pandas实现独热编码][pd.get_dummies()函数]

    快速理解 独热编码前,存在1列x3行的数据: 1列的列名称为: 动物名称 3行中第1行的值为:      猫 3行中第2行的值为:      狗 3行中第3行的值为:      猫 独热编码后,变为2 ...

  5. pd.get_dummies的使用和疑惑解答

    pd.get_dummies的使用 参考pandas官网 pandas.get_dummies(data, prefix=None, prefix_sep='_', dummy_na=False, c ...

  6. 【特征提取】pd.get_dummies() 详解(One-Hot Encoding)

    pd.get_dummies 详解 Pandas.get_dummies 用法简单介绍 主要参数介绍 data prefix prefix_sep 其他参数(Parameters) Pandas.ge ...

  7. pd.get_dummies方法理解

    文章目录 1.举例说明: 1.1 在jupyter notebook里面输入如下代码: 1.2 显示结果: 1.3 使用 pd.get_dummies(data) 1.4结果: 1.举例说明: 1.1 ...

  8. python get dummies_特征提取之pd.get_dummies()

    one-hot encoding one-hot的基本思想:将离散型特征的每一种取值都看成一种状态,若你的这一特征中有N个不相同的取值,那么我们就可以将该特征抽象成N种不同的状态,one-hot编码保 ...

  9. pd.get_dummies,pandas中getget_dummies的用法,python中处理离散值的方法,将文字特征转换成数字特征的方法

    需要用到pandas这个包,调用请提前下载 这个就是用独热编码来替换离散值特征. 例如,"MSZoning"包含值"RL"和"Rm"我们将创 ...

最新文章

  1. 360董事长周鸿祎发表全员信:疫情当前,要做好长期在家办公的准备
  2. element 使用阿里图标变形了_web前端大厂面试题(阿里云笔试篇)
  3. 【转】Powerdesigner逆向工程从sql server数据库生成pdm
  4. 别忘了,明天是BCH的压力测试日
  5. 获取当前周、上一周、下一周日期
  6. leetcode 210. Course Schedule II | 210. 课程表 II(Java)
  7. 有序链表转换二叉搜索树Python解法
  8. 开发环境 Minio 添加桶的操作流程-页面操作
  9. 小学奥数 7834 分成互质组 python
  10. android os 偷跑,不测不知道,原来我们的流量每天都在被“偷”走!
  11. python集合运算_从零开始学Python - 第014课:常用数据结构之集合
  12. How to get the xpath by clicking an html element
  13. 【笔记】定积分的近似计算
  14. Nginx在Linux下的安装部署
  15. linux网卡流量定时记录脚本crontab与手动执行结果不一致问题处理
  16. verilogVGA显示太极图案
  17. 习题5.4 找出4*5矩阵中值最小和最大元素,并分别输出其值及所在的行号和列号。
  18. 另类推柿子 Crypto Lights
  19. 心跳异常检测--使用Keras,K折交叉训练CNN一维卷积
  20. C++程序设计基础实验-实验三 类和对象

热门文章

  1. wind 下装mysql_如何在windows系统下安装MySQL
  2. 课程表WPF制作 学习步骤二
  3. 石头剪刀布 L1-044 稳赢 15分
  4. 用 node.js 爬取煎蛋网照片(仅做学习之用)
  5. php match 1 0,PHP8 新特性 match 表达式详解
  6. 【CSS实战】实现正方体
  7. 修改jar中的class:杀戮尖塔修改教程
  8. AtCoder Beginner Contest 244 B题(超详讲解)
  9. Python实现自动挂机脚本(GUI 打包)
  10. Android 在线预览PDF