系列文章(一):机器学习与深度学习——数据预处理(数值型数据)
系列文章(一):机器学习与深度学习中的数据预处理(数值型数据)
目录
- 系列文章(一):机器学习与深度学习中的数据预处理(数值型数据)
- 一、引言
- 1.1 为何预处理(Why preprocessing?)
- 1.2 预处理会带来什么?(Preprocessing results?)
- 二、数据的分类
- 三、不同类型的数据异常&处理方式
- 3.1 重复(Duplicate)
- 3.1.1 数据重复?(What)
- 3.1.2 为什么处理数据重复?(Why)
- 3.1.3 如何去除重复数据?(How)
- 3.2 缺失(Missing)
- 3.2.1 什么是数据缺失?(What)
- 3.2.2 为什么会有数据缺失&为什么处理?(Why)
- 3.2.3 如何处理Missing data(How)
- 3.3 异常值(Outliers)
- 3.3.1 什么是Outlier?(What)
- 3.3.2 Outlier会影响什么?(Why)
- 3.3.2 Outlier如何发现和去除?(How)
- 3.4 缩放(Scaling)
- 3.4.1 什么是Scaling?(What)
- 3.4.2 为何要进行Scaling?(Why)
- 3.4.3 如何进行Scaling?(How)
- 3.5 数据不平衡(Balancing)
- 3.5.1 什么是Balacing?(What)
- 3.5.2 为何Balacing?(Why)
- 3.5.3 如何进行Scaling?(How)
- 3.6 编码(Encoding)
- 3.6.1 什么是Encoding?(What)
- 3.6.2 如何进行Scaling?(How)
- 3.7 离散化(Discretizing)
- 3.7.1 什么是离散化?(What)
- 3.7.2 如何进行离散化?(How)
- 3.8 创建特征(Feature creation)
- 3.9 选择特征(Feature selection)
- 3.9.1 什么是特征选择?(What)
- 3.9.2 为何特征选择?(Why)
- 3.9.3 如何特征选择?(How)
-
系列文章(一):机器学习与深度学习——数据预处理(数值型数据)相关推荐
- 深度学习——数据预处理篇
深度学习--数据预处理篇 文章目录 深度学习--数据预处理篇 一.前言 二.常用的数据预处理方法 零均值化(中心化) 数据归一化(normalization) 主成分分析(PCA.Principal ...
- 比较全的深度学习数据预处理方法
当前深度学习的预处理方法 1.中心化/零均值化 程序代码 2.标准化/归一化 程序代码 (1)标准化与归一化的联系和差异 联系 差异 (2)为什么要归一化/标准化 ①某些模型求解需要 ②一些分类器需要 ...
- 深度学习-----数据预处理
转自:https://blog.csdn.net/dcxhun3/article/details/47999281 通过最近一段深度学习的学习与实现,发现数据预处理在深度学习中是非常重要的. 数据归一 ...
- 深度学习数据预处理方法及示例
文章目录 一.中心化/零均值化 二.归一化 三.PCA和白化 数据预处理在构建网络模型时是非常重要的,往往能够决定训练结果.当然对于不同的数据集,预处理的方法都会有或多或少的特殊性和局限性.在这里介绍 ...
- 深度学习数据预处理——批标准化(Batch Normalization)
数据预处理最常见的方法就是中心化和标准化,中心化相当于修正数据的中心位置,实现方法非常简单,就是在每个特征维度上减去对应的均值,最后得到 0 均值的特征.标准化也非常简单,在数据变成 0 均值之后,为 ...
- python系列文章(基础,应用,后端,运维,自动化测试,爬虫,数据分析,可视化,机器学习,深度学习系列内容)
python基础教程 python基础系列教程--Python的安装与测试:python解释器.PyDev编辑器.pycharm编译器 python基础系列教程--Python库的安装与卸载 pyth ...
- AI基础:机器学习和深度学习的练习数据
0.导语 初学者学习机器学习和深度学习的时候,经常会找不到练习的数据,本文提供了获取数据的一些方法. 目前我在编写AI基础系列,目前已经发布: AI 基础:简易数学入门 AI 基础:Python开发环 ...
- 2020上半年收集到的优质AI文章 – 机器学习和深度学习
2020上半年收集到的优质AI文章 – 机器学习和深度学习 一文读懂机器学习 机器学习应补充哪些数学基础? 简单梳理一下机器学习可解释性(Interpretability) 什么是CNN?机器学习入门 ...
- 大数据 深度 分页_机器学习、深度学习、大数据 ?傻傻分不清楚?
提起机器学习四个字,不知你的脑海中是否会有一丝印象?毕竟身处信息时代,在日常生活中,无论通过什么媒介,接触到这个名词概念的机会还是挺大的.与之类似,还有以下这些名词概念:数据分析.数据挖 掘.深度学习 ...
最新文章
- 数据结构之队列、双端队列
- ​多视图立体视觉: CVPR 2019 与 AAAI 2020 上的ACMH、ACMM及ACMP算法介绍
- ptr = (char *)malloc(0)
- win10打开程序响应很慢_Win10系统如何关闭全部无响应进程?
- Django模板语法
- html window 属性,html中window对象top 、self 、parent 等属性
- 从「及格线」到优等生,威马只用一台W6
- 【POJ2887】Big String(块状链表,模板)
- python运行不出结果_python程序没有报错但是运行没有任何结果怎么办?
- 莫烦python_莫烦python教学网站
- java递归下降计算四则运算_用递归下降方法实现算术表达式解析器
- 前端HTML银行管理系统界面部分实现
- EMV规范(五)——脱机数据认证
- JavaIO—Day21
- 如果通过Java来完成大数据开发,需要学习哪些内容
- 单片机——自动浇花系统
- CSS中定位属性的常见属性值
- 安装Centos 7系统
- Android模拟器检测体系梳理,android驱动开发入门
- github数据怎么Python爬取
热门文章
- 深度学习——数据预处理篇