Python数据挖掘:数据转换-数据规范化
来源:天善智能韦玮老师课堂笔记
作者:Dust
----------
数据转换:
简单变换
1、数据变换的目的是降数据转化为更方便分析的数据。
2、简单变换通常使用函数变换的方式进行,常见的函数变换包括:开方、平方、对数等。
数据规范化
1、离差标准化--消除量纲(单位)影响以及变异大小因素的影响。
x1=(x-min)/(max-min)
2、标准差标准化--消除单位影响以及变量自身变异影响。
x1=(x-平均数)/标准差
3、小数定标规范化--消除单位影响
x1=x/10**(k)
k=log10(x的绝对值的最大值)
# import pymysql
import pandas as pda
import numpy as npy
data=pda.read_csv("G:/Python/data/starcraft.csv")
#---数据规范化---
#离差标准化
data2=(data-data.min())/(data.max ()-data.min())
print("---data2---")
print(data2)
#标准差标准化
data3=(data-data.mean())/data.std()
print("---data3---")
print(data2)
#小数定标准规范化
k=npy.log10(data.abs().max ())
data4=data/10**k
print("---data4---")
print(data4)
Python数据挖掘:数据转换-数据规范化相关推荐
- Python数据挖掘:数据探索,数据清洗,异常值处理
来源:天善智能韦玮老师 课堂笔记 作者:Dust 探索性数据分析Exploratory Data Analysis,EDA 数据探索的核心是︰ 1.数据质量分析(跟数据清洗密切联系) 2.数据特征分析 ...
- Python数据分析学习笔记:使用SciKit-Learn进行数据规范化
Python数据分析学习笔记:使用SciKit-Learn进行数据规范化 数据规范化是数据挖掘的一项基础工作.不同评价指标往往具有不同的量纲,数值见的差别可能很大,不进行处理可能会影响到数据分析的结果 ...
- python 数据挖掘 之 对数据进行简单预处理(1)
python 数据挖掘 之 对数据进行简单预处理 在我们对数据集进行数据挖掘之前,需要先对数据集进行简单的处理,让数据集变得更规范更具有代表性. 对数据集进行的预处理又许多种,接下来我就简单说几种常用 ...
- python大数据分析实例-如何用Python分析大数据(以Twitter数据挖掘为例)
原标题:如何用Python分析大数据(以Twitter数据挖掘为例) 来源:艾翻译(http://www.itran.cc/) 原文标题:Twitter Data Mining: A Guide to ...
- 【python数据挖掘课程】二十九.数据预处理之字符型转换数值型、标准化、归一化处理
这是<Python数据挖掘课程>系列文章,前面很多文章都讲解了数据挖掘.机器学习,这篇文章主要讲解数据分析预处理中字符特征转换为数值特征.数据标准化.数据归一化,这都是非常基础的工作.最后 ...
- 下载MNIST数据集并使用python将数据转换成NumPy数组(源码解析)
下载MNIST数据集并使用python将数据转换成NumPy数组 首先来分析init_mnist函数 接下来继续分析load_mnist函数 实现数据集转换的python脚本的代码 显示MNIST图像 ...
- python数据挖掘学习笔记】十六.逻辑回归LogisticRegression分析鸢尾花数据
但是很多时候数据是非线性的,所以这篇文章主要讲述逻辑回归及Sklearn机器学习包中的LogisticRegression算法 #2018-03-28 16:57:56 March Wednesday ...
- Python数据挖掘学习笔记】九.回归模型LinearRegression简单分析氧化物数据
#2018-03-23 16:26:20 March Friday the 12 week, the 082 day SZ SSMR [Python数据挖掘学习笔记]九.回归模型LinearRegre ...
- 如何用python分析大数据_Twitter数据挖掘:如何使用Python分析大数据
,拥有16年的程序员培训经验,上市公司品牌,口碑极好,一线名师授课,强大的教研团队研制开发最新的课程,与中关村软件园战略合作保障人才输出,与学员签订就业协议保障就业问题!真正的靠谱品牌! 大数据无处不 ...
最新文章
- django系列 1 :python+django环境搭建 +mac提示找不到manage.py命令
- cmd锁定计算机病毒,反病毒常用CMD命令大全
- UI组件之ImageView及其子类(二)ImageButton ,ZoomButton
- DVT和ADVT - 为数不多的DICOM测试工具说明AND下载
- pip install mysqlclient 报错:error: Microsoft Visual C++ 14.0 is required.
- WPF 创建右键菜单
- 大华相机SDK调用——主动采图、外触发、参数
- 高中计算机教室标语,高中教室布置标语
- animate.css 梦幻西游动画
- 你应该掌握的JavaScript高阶技能(六)
- QT虚拟键盘中英文切换
- 钉钉调用新版待办任务
- 宝塔BT面板专业版(付费)和免费版有什么区别?
- 仅需一步,完美解决 0xc000007b 报错
- C语言 10_随机数
- [4G5G专题-89]:流程 - 4G LTE终端在网络侧不同设备中的状态
- 你见过最奇葩的代码提交信息是什么?别再为写commit message头疼了!
- MongoDB菜鸟教程
- 在线进销存系统sow文档
- 良匠-手把手教你写NFT抢购软(四)