# -*- coding: utf-8 -*-

import pandas

data = pandas.read_csv(

'D:\\PDA\\4.18\\data.csv',

encoding='utf8'

)

data['Education Level'].drop_duplicates()

"""

博士后    Post-Doc

博士      Doctorate

硕士      Master's Degree

学士      Bachelor's Degree

副学士    Associate's Degree

专业院校  Some College

职业学校  Trade School

高中      High School

小学      Grade School

"""

educationLevelDict = {

'Post-Doc': 9,

'Doctorate': 8,

'Master\'s Degree': 7,

'Bachelor\'s Degree': 6,

'Associate\'s Degree': 5,

'Some College': 4,

'Trade School': 3,

'High School': 2,

'Grade School': 1

}

data['Education Level Map'] = data[

'Education Level'

].map(

educationLevelDict

)

data['Gender'].drop_duplicates()

dummies = pandas.get_dummies(

data,

columns=['Gender'],

prefix=['Gender'],

prefix_sep="_",

dummy_na=False,

drop_first=False

)

dummies['Gender'] = data['Gender']

python 分类变量转为哑变量_python 虚拟变量相关推荐

  1. Python之pandas:pandas的get_dummies函数简介(将分类变量转为哑变量)及其使用方法之详细攻略

    Python之pandas:pandas的get_dummies函数简介(将分类变量转为哑变量)及其使用方法之详细攻略 目录 pandas的get_dummies函数简介 pandas.get_dum ...

  2. python 分类变量转为哑变量_Python中的虚拟变量(dummyvariables)

    虚拟变量(dummy variables) 虚拟变量,也叫哑变量和离散特征编码,可用来表示分类变量.非数量因素可能产生的影响. ① 离散特征的取值之间有大小的意义 例如:尺寸(L.XL.XXL) 离散 ...

  3. python 分类变量转为哑变量_机器学习笔记——哑变量处理

    在机器学习的特征处理环节,免不了需要用到类别型特征,这类特征进入模型的方式与一般数值型变量有所不同. 通常根据模型的需要,类别型特征需要进行哑变量处理,即按照特征类别进行编码,一般一个类别为k的特征需 ...

  4. python中声明变量注意要项_Python之变量、常量以及注释

    Python之变量.常量以及注释 一.什么是变量 变量,是用于在内存中存放程序数据的容器,怎么理解呢? 计算机的最核心的功能就是"计算",计算需要数据源,数据源存在在内存里,比如我 ...

  5. python 分类变量转为哑变量_如何转化哑变量

    Python分析建模,日常问题整理(四) 确认过时间,离发工资还有四周. 2018.08.13~2018.08.19 numpy的argmax.arange方法对哑变量的转化 a = numpy.ar ...

  6. python 分类变量转为哑变量_超级详细的特征哑变量处理

    这里全程以df这个为例来讲解 import pandas as pd df=pd.DataFrame({'性别':['男','女','男','女'],'age':[2,3,4,3]}) df get_ ...

  7. python 分类变量转为哑变量_Logistic回归中在什么情况下需要定义分类协变量(哑变量)...

    我也在做这方面的工作.结论,如果协变量为01变量,定义分类变量与不定义分类变量与结果没有差别. 比如,我原始数据中汉族为1,,非汉为0,如果在操作中将其定义为分类协变量,则spss在分析过程中将其改为 ...

  8. python合法的变量名有哪些_Python判断变量名是否合法的方法示例

    问题: 变量名是否合法: 1.变量名可以由字母,数字或者下划线组成 2.变量名只能以字母或者下划线开头 s = 'hello@' 判断变量名的第一个元素是否为字母或者下划线 s[0] 如果第一个元素符 ...

  9. python中输出字体大小改变_python中变量的输入与输出

    python中变量的输入与输出 <1>输出 python中变量的输出 # 打印提示print('hello world')print('给我的卡---印度语,你好的意思')# 输出变量ur ...

最新文章

  1. java 并行多线程素数,多线程求求1000万内的质数数量
  2. C#实现发送手机短信
  3. asp论坛回复功能怎么实现_在asp.netcore中使用中间件(middleware)实现api拦截及验证功能
  4. window wamp中配置安装xhprof步骤(windows)
  5. 断言工具的编写_编写干净的测试–用特定领域的语言替换断言
  6. 手把手教你用FineBI,快速搭建可视化驾驶舱
  7. 爱情九十三课,指尖情话
  8. 找不到服务器micro,Go Micro服务发现
  9. [转]EntityFramework Core技术线路(EF7已经更名为EF Core,并于2016年6月底发布)
  10. ad17如何删除3d实体_3D打印的过程/流程
  11. python调用bing翻译和有道翻译
  12. oracle建索引时报ora00955 名称已由现有对象使用,关于处理ORA-00955: 名称已被现有对象占用的错误...
  13. Windows API用以实现屏幕截图的方法
  14. 用Python制作一条五彩蟒蛇
  15. 【微信小程序】04-公共文件引入
  16. flutter调用android 原生TextView
  17. linux的一些常用工具及需要安装的软件
  18. 【渝粤题库】广东开放大学 大学英语2 形成性考核
  19. Unable to Log You on Because of an Account Restriction问题的解决。
  20. 没别的,就聊聊两个华为网络通信平台

热门文章

  1. python全景图像拼接_Python+OpenCV实现图像的全景拼接
  2. observable_Java Observable deleteObserver()方法与示例
  3. 正则数字字母下划线至少两种_8085微处理器中至少两个8位数字
  4. VS生成的exe文件如何在其他电脑上运行
  5. 如何搭建一个完整的Vue3.0 + ts 的项目
  6. hasset java_java HashSet的使用
  7. python做大屏数据可视化_超强大!Python 可视化这款大屏就够了!
  8. ubuntu安装matlab空间不足,Ubuntu安装Matlab方法及命令
  9. 做自适应网站专业乐云seo_什么叫网站优化-网站建设-SEO优化
  10. python关闭对象语法_Python基础及语法(七)