来源:天善智能韦玮老师课堂笔记
作者:Dust
----------
数据转换:
简单变换
1、数据变换的目的是降数据转化为更方便分析的数据。
2、简单变换通常使用函数变换的方式进行,常见的函数变换包括:开方、平方、对数等。

数据规范化
1、离差标准化--消除量纲(单位)影响以及变异大小因素的影响。
x1=(x-min)/(max-min)
2、标准差标准化--消除单位影响以及变量自身变异影响。
x1=(x-平均数)/标准差
3、小数定标规范化--消除单位影响
x1=x/10**(k)
k=log10(x的绝对值的最大值)

# import pymysql
import pandas as pda
import numpy as npy
data=pda.read_csv("G:/Python/data/starcraft.csv")
#---数据规范化---
#离差标准化
data2=(data-data.min())/(data.max ()-data.min())
print("---data2---")
print(data2)
#标准差标准化
data3=(data-data.mean())/data.std()
print("---data3---")
print(data2)
#小数定标准规范化
k=npy.log10(data.abs().max ())
data4=data/10**k
print("---data4---")
print(data4)

Python数据挖掘:数据转换-数据规范化相关推荐

  1. Python数据挖掘:数据探索,数据清洗,异常值处理

    来源:天善智能韦玮老师 课堂笔记 作者:Dust 探索性数据分析Exploratory Data Analysis,EDA 数据探索的核心是︰ 1.数据质量分析(跟数据清洗密切联系) 2.数据特征分析 ...

  2. Python数据分析学习笔记:使用SciKit-Learn进行数据规范化

    Python数据分析学习笔记:使用SciKit-Learn进行数据规范化 数据规范化是数据挖掘的一项基础工作.不同评价指标往往具有不同的量纲,数值见的差别可能很大,不进行处理可能会影响到数据分析的结果 ...

  3. python 数据挖掘 之 对数据进行简单预处理(1)

    python 数据挖掘 之 对数据进行简单预处理 在我们对数据集进行数据挖掘之前,需要先对数据集进行简单的处理,让数据集变得更规范更具有代表性. 对数据集进行的预处理又许多种,接下来我就简单说几种常用 ...

  4. python大数据分析实例-如何用Python分析大数据(以Twitter数据挖掘为例)

    原标题:如何用Python分析大数据(以Twitter数据挖掘为例) 来源:艾翻译(http://www.itran.cc/) 原文标题:Twitter Data Mining: A Guide to ...

  5. 【python数据挖掘课程】二十九.数据预处理之字符型转换数值型、标准化、归一化处理

    这是<Python数据挖掘课程>系列文章,前面很多文章都讲解了数据挖掘.机器学习,这篇文章主要讲解数据分析预处理中字符特征转换为数值特征.数据标准化.数据归一化,这都是非常基础的工作.最后 ...

  6. 下载MNIST数据集并使用python将数据转换成NumPy数组(源码解析)

    下载MNIST数据集并使用python将数据转换成NumPy数组 首先来分析init_mnist函数 接下来继续分析load_mnist函数 实现数据集转换的python脚本的代码 显示MNIST图像 ...

  7. python数据挖掘学习笔记】十六.逻辑回归LogisticRegression分析鸢尾花数据

    但是很多时候数据是非线性的,所以这篇文章主要讲述逻辑回归及Sklearn机器学习包中的LogisticRegression算法 #2018-03-28 16:57:56 March Wednesday ...

  8. Python数据挖掘学习笔记】九.回归模型LinearRegression简单分析氧化物数据

    #2018-03-23 16:26:20 March Friday the 12 week, the 082 day SZ SSMR [Python数据挖掘学习笔记]九.回归模型LinearRegre ...

  9. 如何用python分析大数据_Twitter数据挖掘:如何使用Python分析大数据

    ,拥有16年的程序员培训经验,上市公司品牌,口碑极好,一线名师授课,强大的教研团队研制开发最新的课程,与中关村软件园战略合作保障人才输出,与学员签订就业协议保障就业问题!真正的靠谱品牌! 大数据无处不 ...

最新文章

  1. django系列 1 :python+django环境搭建 +mac提示找不到manage.py命令
  2. cmd锁定计算机病毒,反病毒常用CMD命令大全
  3. UI组件之ImageView及其子类(二)ImageButton ,ZoomButton
  4. DVT和ADVT - 为数不多的DICOM测试工具说明AND下载
  5. pip install mysqlclient 报错:error: Microsoft Visual C++ 14.0 is required.
  6. WPF 创建右键菜单
  7. 大华相机SDK调用——主动采图、外触发、参数
  8. 高中计算机教室标语,高中教室布置标语
  9. animate.css 梦幻西游动画
  10. 你应该掌握的JavaScript高阶技能(六)
  11. QT虚拟键盘中英文切换
  12. 钉钉调用新版待办任务
  13. 宝塔BT面板专业版(付费)和免费版有什么区别?
  14. 仅需一步,完美解决 0xc000007b 报错
  15. C语言 10_随机数
  16. [4G5G专题-89]:流程 - 4G LTE终端在网络侧不同设备中的状态
  17. 你见过最奇葩的代码提交信息是什么?别再为写commit message头疼了!
  18. MongoDB菜鸟教程
  19. 在线进销存系统sow文档
  20. 良匠-手把手教你写NFT抢购软(四)

热门文章

  1. Java substring使用时有哪些注意事项?
  2. 当有人看不起你时,要懂得反省自己
  3. 人生的路上,要懂得坚强
  4. 《将要淘汰的八种人》读后感
  5. pretty_errors_python
  6. distill bert 相关问题
  7. 一本读懂BERT(实践篇)重点
  8. \r \r\n \t的区别
  9. 深度学习编译器综述The Deep Learning Compiler
  10. YOLOv4全文阅读(全文中文翻译)