python实现数据编码(独热编码+归一化)
实现功能:
python实现数据编码,对离散型变量进行独热编码,对数值型变量进行归一化处理。
实现代码:
import numpy as np import pandas as pddef Read_data(file):dt = pd.read_csv(file)dt.columns = ['age', 'sex', 'chest_pain_type', 'resting_blood_pressure', 'cholesterol','fasting_blood_sugar', 'rest_ecg', 'max_heart_rate_achieved','exercise_induced_angina','st_depression', 'st_slope', 'num_major_vessels', 'thalassemia', 'target']data =dtpd.set_option('display.max_rows', None)pd.set_option('display.max_columns', None)pd.set_option('display.width', None)pd.set_option('display.unicode.ambiguous_as_wide', True)pd.set_option('display.unicode.east_asian_width', True)print(data.head())return datadef data_encoding(data):#========================数据编码===========================data = data[["age", 'sex', "chest_pain_type", "resting_blood_pressure", "cholesterol","fasting_blood_sugar", "rest_ecg","max_heart_rate_achieved", "exercise_induced_angina","st_depression", "st_slope", "num_major_vessels","thalassemia"]]Discretefeature=['sex',"chest_pain_type", "fasting_blood_sugar", "rest_ecg","exercise_induced_angina", "st_slope", "thalassemia"]Continuousfeature=["age", "resting_blood_pressure", "cholesterol","max_heart_rate_achieved","st_depression","num_major_vessels"]df = pd.get_dummies(data,columns=Discretefeature)print(df.head())df[Continuousfeature]=(df[Continuousfeature]-df[Continuousfeature].mean())/(df[Continuousfeature].std())print(df.head())return dfif __name__=="__main__":data1=Read_data("F:\数据杂坛\\0504\heartdisease\Heart-Disease-Data-Set-main\\UCI Heart Disease Dataset.csv")# Segment_statistics(data1)data2=data_encoding(data1)
实现效果:
喜欢记得点赞,在看,收藏,
关注V订阅号:数据杂坛,获取完整代码和效果,将持续更新!
python实现数据编码(独热编码+归一化)相关推荐
- 独热编码python实现_独热编码(one-hot coding)
1 为什么需要独热编码? 直接上案例,一份数据,特征为["颜色", "尺码", "喜欢度", "类别"],具体数据为[[ ...
- python 独热码_数据预处理:独热编码(One-Hot Encoding)
问题由来 在很多机器学习任务中,特征并不总是连续值,而有可能是分类值. 例如,考虑一下的三个特征: ["male", "female"] ["from ...
- python pandas 独热编码
python pandas 独热编码 import pandas as pd df1 = pd.DataFrame({'姓名': ['周', '武', '郑'],'成绩': [100, 96, 77] ...
- Python下数值型与字符型类别变量独热编码(One-hot Encoding)实现
1 OneHotEncoder 2 pd.get_dummies 在数据处理与分析领域,数值型与字符型类别变量的编码是不可或缺的预处理操作.本文基于Python下OneHotEncoder与pd. ...
- 5.sklearn之转换器(划分训练集和测试集、以及标准化、归一化数据会用transform,独热编码也会用到)
文章目录 1. 什么是转换器? 2. 测试集和训练集 2.1 训练集 .测试集.验证集 2.2 拆分训练集测试集有个问题 2.3 代码 3. 标准化 3.1 上离差标准化代码(举一反三就好了,其他几个 ...
- 独热编码python实现_详解深度学习中的独热编码
很多人开始接触深度学习,数据处理遇到第一个专业英文术语就是one-hot encode(独热编码),很多初学者就会迷茫,这个东西是什么意思,其实说的直白点所谓的独热编码最重要的就是把一组字符串或者数字 ...
- Python实现独热编码
关于独热编码与哑变量编码的概念,可以参考:https://blog.csdn.net/qq_41853758/article/details/81252174. 离散特征的编码分为两种情况: 1.离散 ...
- python 独热码_One-hot coding(独热编码)
在数据预处理中,为了方便模型的输入,常常会把非数值类型量化成数值类型. 其中比较简单的一种处理离散型数值编码方式叫one-hot coding(独热编码) 1.概念 独热编码即 One-Hot 编码, ...
- Python数据分析数据预处理特征值独热编码
[小白从小学Python.C.Java] [Python-计算机等级考试二级] [Python-数据分析] Python数据分析 数据预处理 特征值独热编码 独热编码,是一种将分类变量转换为若干二进制 ...
最新文章
- 吴恩达深度学习ppt_【深度学习】吴恩达谈深度学习:数据科学家需要知道这些...
- “算法不行,干啥都不行!”面试官:面试基本都会考这点!
- 腾讯优图8篇论文入选ECCV 2020,涵盖目标检测/跟踪/Re-ID/人脸等领域
- win11频繁更新,关闭win11恶意软件删除工具补丁更新
- 为加快SAP Commerce Cloud在windows服务器上的启动速度,而禁用的一些服务
- uva 10140——Prime Distance
- 安装配置Eclipse开发PHP环境配置
- macos实现输入文件输入结束符
- JSON字符串和对象之间的转换
- 浏览器地址栏中加入ico图标的二种方法
- mysql主从复制(master 、salve)
- linux pdf 编辑图层,PDF SDK DEMO
- 什么是封装、继承和多态
- iOS8官方推荐图标和图像尺寸
- 俄勒冈州立大学研发脱口秀机器人,全美巡演数十场获好评
- 拂去风尘回家的风景最美
- Ubuntu 18.04 chia 远程收割机 harvester 多台
- SOLIDWORKS motion如何进行运动仿真
- Locating Elements
- 炫酷登录注册界面【超级简单 jQuery+JS+HTML+CSS实现】