ML之FE:对pandas的dataframe中的类别型字段进行数字编码化(类别型特征数值化)并导出映射表daiding

目录

对pandas的dataframe中的类别型字段进行数字编码化(类别型特征数值化)并导出映射表


对pandas的dataframe中的类别型字段进行数字编码化(类别型特征数值化)并导出映射表

# ML之FE:对pandas的dataframe中的类别型字段进行数字编码化(类别型特征数值化)并导出映射表
from sklearn.preprocessing import LabelEncoder
from NDataScience.DataAnalysis import Dict2DfByRow
for col in df.columns:print(col,df[col].dtype)if df[col].dtype in ['float64', 'int', 'int64']:df[col] = pd.to_numeric(df[col])else:# 全部字符串化df[col] = df[col].apply(str)# 编码化LbE = LabelEncoder()LbE.fit(df[col])df[col] = LbE.transform(df[col])#导出映射表:开发逻辑中需要mapping_dict = dict(zip(LbE.classes_, range(1, len(LbE.classes_) + 1)))mapping_dict = {encode: label for label, encode in enumerate(LbE.classes_)}Dict2DfByRow(mapping_dict,mark=col)

ML之FE:对pandas的dataframe中的类别型字段进行数字编码化(类别型特征数值化)并导出映射表daiding相关推荐

  1. Python中pandas检查dataframe中是否包含某个字段、或者数据列实战、检查dataframe中是否包含某个字段集合

    Python中pandas检查dataframe中是否包含某个字段.或者数据列(column)实战 目录 Python中pandas检查dataframe中是否包含某个字段.或者数据列(column) ...

  2. ML之FE:pandas库中数据分析利器之groupby分组函数、agg聚合函数、同时使用groupby与agg函数组合案例之详细攻略

    ML之FE:pandas库中数据分析利器之groupby分组函数.agg聚合函数.同时使用groupby与agg函数组合案例之详细攻略 目录 pandas库中数据分析利器之groupby分组函数.ag ...

  3. ML之FE:在模型训练中,仅需两行代码实现切分训练集和测试集并分离特征与标签

    ML之FE:在模型训练中,仅需两行代码实现切分训练集和测试集并分离特征与标签 目录 仅需两行代码实现切分训练集和测试集并分离特征与标签 输出结果 实习代码 仅需两行代码实现切分训练集和测试集并分离特征 ...

  4. python使用pandas计算dataframe中每个分组的分位数极差、分组数据的分位数极差(range)、使用groupby函数和agg函数计算分组的两个分位数

    python使用pandas计算dataframe中每个分组的分位数极差.分组数据的分位数极差(range).使用groupby函数和agg函数计算分组的两个分位数 目录

  5. pandas将dataframe中的年、月、日数据列合并成完整日期字符串、并使用to_datetime将字符串格式转化为日期格式

    pandas将dataframe中的年.月.日数据列合并成完整日期字符串.并使用to_datetime将字符串格式转化为日期格式 目录

  6. python使用pandas计算dataframe中每个分组的极差、分组数据的极差(range)、使用groupby函数和agg函数计算分组的最大值和最小值

    python使用pandas计算dataframe中每个分组的极差.分组数据的极差(range).使用groupby函数和agg函数计算分组的最大值和最小值 目录

  7. pandas使用split函数将dataframe中的特定列表字段(list column)裂变为多个数据列并拼接到原dataframe中

    pandas使用split函数将dataframe中的特定列表字段(list column)裂变为多个数据列并拼接到原dataframe中(splitting column of lists into ...

  8. pandas将dataframe中的特定数据列的内容转化为列表list数据(convert dataframe column values into a list)

    pandas将dataframe中的特定数据列的内容转化为列表list数据(convert dataframe column values into a list) 目录 pandas将datafra ...

  9. pandas获取dataframe中索引值最大值所在的数据行(get dataframe row of max index value)

    pandas获取dataframe中索引值最大值所在的数据行(get dataframe row of max index value) 目录 pandas获取dataframe中索引值最大值所在的数 ...

最新文章

  1. 年轻人的第一块金牌:我是如何成为 Kaggle 全网第一的
  2. 一种快速统计SQL Server每个表行数的方法
  3. 新浪php面试题目,新浪php的面试题 收集
  4. 1-趣味解读DNS工作原理——转载疯猫网络科技
  5. 【c++】28.虚析构函数、纯虚函数
  6. 快速傅里叶变换之后的结果含义
  7. shell 执行失败重试_Uipath 机器人总是运行失败怎么办?
  8. Git添加为远程仓库
  9. Pytorch《DCGAN模型》
  10. 2019.8.21一些面试题以及记录
  11. 灵感库 | 让设计师欲罢不能的设计网站
  12. mysql innodb架构_Mysql Innodb体系结构
  13. mysql 保存时间报错_JPA在MySQL数据库中保存错误的日期
  14. js 加密url java_js 对 URL 参数进行 加密 解密
  15. JAVA基础-XML的解析
  16. 设计模式之————依赖注入(Dependency Injection)与控制反转(Inversion of Controller)...
  17. 其他干货——如何做科学报告(oral, poster, eLightning)
  18. 晒一波程序员的桌面,逼格超级高
  19. 电脑怎么把大量音频合并
  20. Kotlin技术 - 委托和代理

热门文章

  1. WinSock五种I/O模型的性能分析
  2. Android App开发——使用CameraX打开前后摄像头拍照并保存(Java实现)
  3. php多个 r n如何过滤,php怎么去掉r n
  4. FIFO and DMA
  5. 几步实现stm32上面移植mqtt
  6. Bringing up interface eth0: Error: Unknown connection: 0e4faef8-9838-4a5d-8d08-47ed5e4415c7.
  7. document 文挡对象 - JavaScript脚本语言描述
  8. 30个流行的jQuery Plugins
  9. 解决内存不可read和written的问题
  10. 敢不敢模拟超过 5 万的并发用户?