python数据分析预处理z-score标准化
一、z-score标准化的python代码
import pandas
from pandas import read_excel
from sklearn import preprocessingdataset = read_excel('processing2.xlsx', header=0, index_col=0)
values = dataset.values #dataframe转换为array数组类型
values = values.astype('float32') #定义数据类型data = preprocessing.scale(values)
df=pandas.DataFrame(data) #将array还原为dataframedf.columns=dataset.columns #命名标题行df.to_excel ('processing3.xlsx',index=None) #另存为excel,删除索引
使用机器学习sklearn的scaler方法进行z- score标准化只需一行:
from sklearn import preprocessing
data = preprocessing.scale(values) #注意,这里的values是array
然后再加两步:将dataframe转化为array,以及将array还原为dataframe即可!
python数据分析预处理z-score标准化相关推荐
- python数据预处理 :数据标准化
何为标准化: 在数据分析之前,我们通常需要先将数据标准化(normalization),利用标准化后的数据进行数据分析.数据标准化也就是统计数据的指数化.数据标准化处理主要包括数据同趋化处理和无量纲化 ...
- 【数据分析入门】python数据分析全过程梳理与代码实现
文章目录 数据分析 数据获取 探索分析与可视化 预处理理论 分析建模 评估模型 数据分析 数据获取 [数据分析入门]python数据分析之数据获取方法 探索分析与可视化 [数据分析入门]python数 ...
- Python数据分析中的数据预处理:数据标准化
[小白从小学Python.C.Java] [Python全国计算机等级考试] [Python数据分析考试必会题] ● 标题与摘要 Python数据分析中的 数据预处理:数据标准化 ● 选择题 以下关于 ...
- Python数据分析:异常值检验的两种方法 -- Z 分数 上下分位点(放入自写库,一行代码快速实现)
本文已在公众号 " 数据分析与商业实践 " 首发.关注一下~,更多商业数据分析案例源码等你来撩.后台回复 "异常值" ,即可获取本文的案例示范与包含详细注释的源 ...
- Python数据分析中数据预处理:编码将文字型数据转换为数值型
[小白从小学Python.C.Java] [Python-计算机等级考试二级] [Python-数据分析] Python数据分析中 数据预处理:编码 将文字型数据转换为数值型 选择题 对于以下pyth ...
- Python数据分析-数据预处理
数据预处理 文章目录 数据预处理 1.前言 2.数据探索 2.1缺失值分析 2.2 异常值分析 2.2.1 简单统计量分析 2.2.2 3$\sigma$原则 2.2.3 箱线图分析 2.3 一致性分 ...
- python dataframe groupby_【Python数据分析基础】入坑必备的数据预处理操作
本文解决的是2类目标业务: 有数据不知道怎么做数据分析操作的. 自己有思路不知道怎么落地实现的. Python数据分析基础必用品 office软件(推荐2016版) Python开发环境(推荐Anac ...
- python预处理标准化_tensorflow预处理:数据标准化的几种方法
tensorflow预处理:数据标准化的几种方法 发布时间:2018-08-09 19:39, 浏览次数:1774 , 标签: tensorflow 数据归一化问题是数据挖掘中特征向量表达时的重要问题 ...
- 【Python数据分析】数据预处理3——数据规约(含主成分分析详解、Python主要预处理函数)
数据规约产生更小且保持完整性的新数据集,在规约后的数据集上进行分析和挖掘将提高效率 一.属性规约 属性规约通过属性合并创建新属性维数,或者通过直接删除不相关的属性来减少数据维数,从而提高数据挖掘的效率 ...
最新文章
- 6月技术福利限时免费领
- 在腾讯待了 9 年,还是离了职
- atomic原子类实现机制_Java并发包-atomic包-让您彻底掌握AtomicInteger源码
- h5比html新增加的标签,HTML5(H5)新增属性和标签
- 基于C++实现五子棋AI算法思想
- add separator in the sessionmenu
- 在linux下解压jdk时出现的问题
- 高性能MySQL读书笔记 (五)
- 2017-08-16 BEX5下集成FullCalendar
- python编程和继承_python面向对象编程-继承与派生
- MongoDB-Replication Replica Set Arbiter
- 【C++】获取二维数组的行和列
- python逻辑运算符例子_python运算符-实战中常用的三个逻辑运算符使用实例
- 【19】蓝桥杯之奇妙的数字(填空题)
- HD TUNE 下载使用
- oracle数据库greatest函数,ORACLE函数之GREATEST函数详解范例
- 0基础看-最大似然函数,原理,基本概念,例子
- Log4j史诗级漏洞,我们这些小公司能做些什么?
- win7计算机亮度怎么调节,win7系统屏幕亮度怎么修改调整
- 抽奖机(用随机数)2.0-python
热门文章
- matlab BP神经网络 newff
- 多任务学习(Multi-task)keras实现
- 谈谈你对Spring的理解?
- rc4算法安全漏洞_TLS/SSL协议 RC4算法安全漏洞
- 【机器学习】机器学习算法之——K最近邻(k-Nearest Neighbor,KNN)分类算法原理讲解...
- wordpres情话小程序源码开源带教程
- 20181206 周四 日记
- OpenFire源码学习之二十二:openfie对用户的优化(下)
- 软件测试面试真题 | Selenium 的工作原理是什么?
- C#编写Windows桌面应用程序在窗体上滚动字幕