ML之FE:对pandas的dataframe中的类别型字段进行数字编码化(类别型特征数值化)并导出映射表daiding
ML之FE:对pandas的dataframe中的类别型字段进行数字编码化(类别型特征数值化)并导出映射表daiding
目录
对pandas的dataframe中的类别型字段进行数字编码化(类别型特征数值化)并导出映射表
对pandas的dataframe中的类别型字段进行数字编码化(类别型特征数值化)并导出映射表
# ML之FE:对pandas的dataframe中的类别型字段进行数字编码化(类别型特征数值化)并导出映射表
from sklearn.preprocessing import LabelEncoder
from NDataScience.DataAnalysis import Dict2DfByRow
for col in df.columns:print(col,df[col].dtype)if df[col].dtype in ['float64', 'int', 'int64']:df[col] = pd.to_numeric(df[col])else:# 全部字符串化df[col] = df[col].apply(str)# 编码化LbE = LabelEncoder()LbE.fit(df[col])df[col] = LbE.transform(df[col])#导出映射表:开发逻辑中需要mapping_dict = dict(zip(LbE.classes_, range(1, len(LbE.classes_) + 1)))mapping_dict = {encode: label for label, encode in enumerate(LbE.classes_)}Dict2DfByRow(mapping_dict,mark=col)
ML之FE:对pandas的dataframe中的类别型字段进行数字编码化(类别型特征数值化)并导出映射表daiding相关推荐
- Python中pandas检查dataframe中是否包含某个字段、或者数据列实战、检查dataframe中是否包含某个字段集合
Python中pandas检查dataframe中是否包含某个字段.或者数据列(column)实战 目录 Python中pandas检查dataframe中是否包含某个字段.或者数据列(column) ...
- ML之FE:pandas库中数据分析利器之groupby分组函数、agg聚合函数、同时使用groupby与agg函数组合案例之详细攻略
ML之FE:pandas库中数据分析利器之groupby分组函数.agg聚合函数.同时使用groupby与agg函数组合案例之详细攻略 目录 pandas库中数据分析利器之groupby分组函数.ag ...
- ML之FE:在模型训练中,仅需两行代码实现切分训练集和测试集并分离特征与标签
ML之FE:在模型训练中,仅需两行代码实现切分训练集和测试集并分离特征与标签 目录 仅需两行代码实现切分训练集和测试集并分离特征与标签 输出结果 实习代码 仅需两行代码实现切分训练集和测试集并分离特征 ...
- python使用pandas计算dataframe中每个分组的分位数极差、分组数据的分位数极差(range)、使用groupby函数和agg函数计算分组的两个分位数
python使用pandas计算dataframe中每个分组的分位数极差.分组数据的分位数极差(range).使用groupby函数和agg函数计算分组的两个分位数 目录
- pandas将dataframe中的年、月、日数据列合并成完整日期字符串、并使用to_datetime将字符串格式转化为日期格式
pandas将dataframe中的年.月.日数据列合并成完整日期字符串.并使用to_datetime将字符串格式转化为日期格式 目录
- python使用pandas计算dataframe中每个分组的极差、分组数据的极差(range)、使用groupby函数和agg函数计算分组的最大值和最小值
python使用pandas计算dataframe中每个分组的极差.分组数据的极差(range).使用groupby函数和agg函数计算分组的最大值和最小值 目录
- pandas使用split函数将dataframe中的特定列表字段(list column)裂变为多个数据列并拼接到原dataframe中
pandas使用split函数将dataframe中的特定列表字段(list column)裂变为多个数据列并拼接到原dataframe中(splitting column of lists into ...
- pandas将dataframe中的特定数据列的内容转化为列表list数据(convert dataframe column values into a list)
pandas将dataframe中的特定数据列的内容转化为列表list数据(convert dataframe column values into a list) 目录 pandas将datafra ...
- pandas获取dataframe中索引值最大值所在的数据行(get dataframe row of max index value)
pandas获取dataframe中索引值最大值所在的数据行(get dataframe row of max index value) 目录 pandas获取dataframe中索引值最大值所在的数 ...
最新文章
- 年轻人的第一块金牌:我是如何成为 Kaggle 全网第一的
- 一种快速统计SQL Server每个表行数的方法
- 新浪php面试题目,新浪php的面试题 收集
- 1-趣味解读DNS工作原理——转载疯猫网络科技
- 【c++】28.虚析构函数、纯虚函数
- 快速傅里叶变换之后的结果含义
- shell 执行失败重试_Uipath 机器人总是运行失败怎么办?
- Git添加为远程仓库
- Pytorch《DCGAN模型》
- 2019.8.21一些面试题以及记录
- 灵感库 | 让设计师欲罢不能的设计网站
- mysql innodb架构_Mysql Innodb体系结构
- mysql 保存时间报错_JPA在MySQL数据库中保存错误的日期
- js 加密url java_js 对 URL 参数进行 加密 解密
- JAVA基础-XML的解析
- 设计模式之————依赖注入(Dependency Injection)与控制反转(Inversion of Controller)...
- 其他干货——如何做科学报告(oral, poster, eLightning)
- 晒一波程序员的桌面,逼格超级高
- 电脑怎么把大量音频合并
- Kotlin技术 - 委托和代理
热门文章
- WinSock五种I/O模型的性能分析
- Android App开发——使用CameraX打开前后摄像头拍照并保存(Java实现)
- php多个 r n如何过滤,php怎么去掉r n
- FIFO and DMA
- 几步实现stm32上面移植mqtt
- Bringing up interface eth0: Error: Unknown connection: 0e4faef8-9838-4a5d-8d08-47ed5e4415c7.
- document 文挡对象 - JavaScript脚本语言描述
- 30个流行的jQuery Plugins
- 解决内存不可read和written的问题
- 敢不敢模拟超过 5 万的并发用户?