1、读取数据(X:独立数据、Y:联动数据)

处理之前的数据#导入包

import numpy as np #矩阵

import matplotlib.pyplot as plt #数据展示、可视化

import pandas as pd    #数据预处理

#import dataset

datasets = pd.read_csv('Data.csv')

#missing data 丢失数据处理 1、去最大值 最小值,2、平均数 3、删除

X = datasets.iloc[:,:-1].values  #取出独立变量

Y = datasets.iloc[:,3].values

#数据预处理,补充缺失数据

from sklearn.preprocessing import Imputer

#mean 缺失的用平均数填充

#怎么处理数据

imputer = Imputer(missing_values = 'NaN', strategy = 'mean', axis = 0)

#处理哪里的数据

imputer = imputer.fit( X[:, 1:3])

X[:,1:3] = imputer.transform( X[:,1:3])

#查看补充缺失数据之后的数据

X

解释:“imputer = Imputer(missing_values = 'NaN', strategy = 'mean', axis = 0):

NaN:缺失数据

strategy:缺失数据处理方式,平均值,

If “mean”, then replace missing values using the mean along the axis.

If “median”, then replace missing values using the median along the axis.

If “most_frequent”, then replace missing using the most frequent value along the axis.

axis:

Ifaxis=0, then impute along columns.Ifaxis=1, then impute along rows.

2、查看补充缺失数据之后的数据

补充缺失之后的数据

python金融数据缺失处理_机器学习之Python数据缺失处理相关推荐

  1. python多维向量聚类_机器学习:Python实现聚类算法(三)之总结

    考虑到学习知识的顺序及效率问题,所以后续的几种聚类方法不再详细讲解原理,也不再写python实现的源代码,只介绍下算法的基本思路,使大家对每种算法有个直观的印象,从而可以更好的理解函数中参数的意义及作 ...

  2. python线性回归分析看相关性_机器学习入门-相关分析之简单线性回归

    一.什么是机器学习? 简单来说,机器学习是一类算法的总称,这些算法企图从大量历史数据中挖掘出其中隐含的规律,并用于预测或者分类,更具体的说,机器学习可以看作是寻找一个函数,输入是样本数据,输出是期望的 ...

  3. python创建类统计属性_轻松创建统计数据的Python包

    python创建类统计属性 介绍 (Introduction) Sometimes you may need a distribution figure for your slide or class ...

  4. python金融工程的工具包_《华尔街学堂:三大金融技能工具——Wind. Excel 与 Python》...

    课程目录: Excel实务技能与金融应用 课时 14 课件资料 第01讲课程练习-Councils 2015_25 LTP Financial Data.xlsx 第2 & 3讲练习(1).x ...

  5. python 讲义 马永亮_资源 | 177G Python/机器学习/深度学习/算法/TensorFlow等视频,涵盖入门/中级/项目各阶段!...

    8. 西安交大应用统计分析SPSS1-48讲 9. Python科学计算 10. Neural Network for Machine Learning (英文字幕) 11. python教程(马永亮 ...

  6. python数据科学手册_小白入门Python数据科学

    前言 本文讲解了从零开始学习Python数据科学的全过程,涵盖各种工具和方法 你将会学习到如何使用python做基本的数据分析 你还可以了解机器学习算法的原理和使用 说明 先说一段题外话.我是一名数据 ...

  7. python金融工程的工具包_金融工程及其Python应用

    目 录 第1章 金融工程导论 1 1.1 金融工程的概念 2 1.2 国外现代主流金融理论发展历程 2 1.3 国内金融的发展 3 1.4 现代主流金融理论简介 4 1.4.1 投资组合理论 4 1. ...

  8. numpy二维数组改变某些数_机器学习:Python常用库——Numpy库

    从前面的学习中我们知道,机器学习是以大量数据为基础的. 由此就引出一个问题:那么多的数据我们要如何处理呢? 别担心,嘻嘻,Python开发人员早有准备. 为了拓宽数据科学方面的应用,Numpy库应运而 ...

  9. python调用库有哪些_十大Python机器学习常用库 python开发,你用过几个?

    1.Pipenv Pipenv 是 Kenneth Reitz 的业余项目,旨在将其他软件包(例如 npm 和 yarn)整合到 Python 里.它不需要安装 virtualenv, virtual ...

  10. python画车辆轨迹图_如何利用 Python 绘制酷炫的 车辆轨迹 — 速度时空图?三维数据用二维图像呈现...

    说明:本文系交通攻城狮原创文章,如需转载请私信联系,侵权必究. 2020,第 30 期,编程笔记 建议直接阅读精编版:如何利用 Python 绘制酷炫的 车辆轨迹 - 速度时空图?三维数据用二维图像呈 ...

最新文章

  1. 大学计算机科学系口号,各大学学院口号
  2. 斯坦福团队开发智能盲杖,搭载激光雷达,可探测障碍规划路线,完全开源可在家DIY...
  3. 2021年春季学期-信号与系统-第五次作业参考答案-第四小题
  4. 解决android 异常导致应用程序停止运行的错误
  5. 创建 Java 第三方类库,以及制作类库的Javadoc
  6. 机器人学习--Robotics 4:Perception(宾夕法尼亚大学COURSERA课程)
  7. P3343-[ZJOI2015]地震后的幻想乡【dp,数学期望】
  8. java动态扩展_java栈内存动态扩展要怎么理解?要如何实现?
  9. HTML和css学术报告,清华大学 张超 副教授访问我院并做学术报告
  10. 互联网晚报 | 8月30日 星期一 | 微信公众号新增“我的商店”功能;vivo明年上半年推出平板;商汤科技在港递交IPO招股书...
  11. 2008域控服务器创建本地用户,windows 2008 r2 用域帐户登陆后怎么修改本地用户密码?...
  12. 潜在语义索引(Latent Semantic Indexing, LSI)——快速教程
  13. Matlab:Matlab 软件学习之GUI图像用户界面简介(工具栏/菜单栏/对话框)、GUI界面设计案例应用(设计二级菜单栏)之详细攻略
  14. (2019.07) BSV 链上运算模型
  15. 增强型for循环与Map集合的遍历
  16. 用梅森公式求复杂电路系统传递函数
  17. 内江求是中学计算机应用有哪些,内江市求是职业技术学校(内江市求是中学)官网/招生网2020网址...
  18. mysql开发语言,纯干货
  19. python里find是什么函数_Python find函数用法和概念
  20. 智能手机高端“酣战”,转机在何方?

热门文章

  1. 华为那些手机有鸿蒙系统,华为鸿蒙系统支持哪些手机 鸿蒙系统支持哪些手机型号...
  2. 最小生成树算法(普利姆算法和克鲁斯卡尔算法)---抄自天勤数据结构高分笔记
  3. shell脚本实现彩色进度条
  4. 微信小程序│ 游戏开发 │连连看游戏
  5. 讲解:微信内直接打开第三方app
  6. python中对文件的操作总结
  7. PageHelper.startPage(pageNum,pageSize)分页不起作用
  8. Oracle PL / SQL – INSTEAD OF触发器示例
  9. java设置word图片居中_Word中怎样快速对齐图片?这样操作,效率提升10倍
  10. office 2010图标出现异常时的解决办法