1.数据载入和总览

首先导入要是用的包

#导入需要画图的包import matplotlib.pyplot as plt%matplotlib inline#导入numpys,pandas的包import numpy as np

import pandas as pd

from pandas import Series,DataFrame

1.1数据导入

%%timecontb1 = pd.read_csv('./usa_elect/contb_01.csv')contb2 = pd.read_csv('./usa_elect/contb_02.csv')contb3 = pd.read_csv('usa_elect/contb_03.csv')

注:%%time是jupyter notebook的魔法指令可以查看指令运行的时间,这里会显示加载文件时间


1.2数据合并

将上述三个文件合并起来,代码如下:

contb = pd.concat([contb1,contb2,contb3],axis=0)#查看合并后的前五条信息contb.head()

**注:concat函数是pandas里强大的合并方法,很多人不明白如何设置参数axis,这里一步到位,axis=0,可以理解为数据跨越行合并,axis=1可以理解为数据跨越列合并。是不是还不明白?没有关系看下面实例




1.3数据预览和基本统计分析

contb.shape#数据总共有1001733条,总共有七列(1001733,7)

2.数据清洗

从网络获取的数据一般都是杂乱无章的可以用英文‘RAW’来描述,并不能直接拿来使用,那可咋办,没关系pandas早已准备好了!

2.1缺失值处理

大量数据录入时难免会因一些原因造成某些值缺失,这些缺失值会以NaN来填充,但做数据分析时若不处理空值是很影响分析结果的,咱总不能让boss看到不大准确的分析结果吧,一般处理情况时删除缺失值或者填补一些默认值上去(例如平均值)。看我pandas如何打死你这小妖

1 Pandas实例(一)-2012美国大选政治献金实例相关推荐

  1. 2012美国大选献金项目数据分析

    文章目录 1.数据载入与预览 1.1 数据加载 1.2 数据合并 1.3 数据预览 1.3.1 查看是否有空值 1.3.2用统计学指标快速描述数值型属性的概要 2.数据的预处理 2.1 数据清洗 2. ...

  2. 利用python进行数据分析-14.5 2012美国大选数据分析(基础复习)

    美国大选数据分析 导入数据及相关库 数据清洗 填充缺失值 数据转换 面元化数据(分桶) 数据聚合与分组运算 时间处理 str转datetime(datetime为时间序列数据类型) 重新采样和频率转换 ...

  3. 美国2012政治献金数据分析(附有源数据和题目)

    读取文件usa_election.txt 查看文件样式及基本信息 指定数据截取,将如下字段的数据进行提取,其他数据舍去: cand_nm :候选人姓名 contbr_nm :捐赠人姓名 contbr_ ...

  4. 数据分析---2012美国大选献金项目数据分析

    需求: 1. 加载数据 df = pd.read_csv('./data/usa_election.txt') 2. 对新数据进行总览,查看是否存在缺失数据: 方法一:isnull.notnull.a ...

  5. Pandas方法实践-2012美国总统竞选赞助数据分析

    目录 1. 数据载入和总览 1.1 数据载入(pd.read_csv()) 1.2 数据合并(pd.concat()) 1.3 数据预览和基本统计分析 2. 数据清洗 2.1 缺失值处理​ 2.2 数 ...

  6. pandas数据分析案例--2012美国总统竞选赞助数据分析

    美国总统竞选赞助数据分析 本文内容参考阿里云天池实验室,在原有基础上添加了一些结论的分析. 原案例地址 数据来源 1.首先导入相关的python数据分析的库 import pandas as pd i ...

  7. 【数据分析】使用pandas和numpy分析美国大选献金项目

    1. 数据载入与总览 1.1 数据加载 #绘图工具 import matplotlib.pyplot as plt %matplotlib inline #数据处理工具 import numpy as ...

  8. 2012美国大选献金项目(最详细解释)

    1. 数据载入和总览 import numpy as npimport pandas as pdfrom pandas import Series,DataFrame 1.1 数据载入 df1 = p ...

  9. pandas - 案例(美国2012年总统候选人政治献金数据分析)

    # 提供数据months = {'JAN' : 1, 'FEB' : 2, 'MAR' : 3, 'APR' : 4, 'MAY' : 5, 'JUN' : 6,'JUL' : 7, 'AUG' : ...

  10. 3 Python数据分析 美国各州人口分析案例 Pandas高级操作 美国大选献金案例 matplotlib

    Python数据分析 1 案例 美国各州人口分析 1.1 数据介绍 数据来源:https://github.com/jakevdp/data-USstates/ 1.1.1 州人口数量表 state- ...

最新文章

  1. input type右对齐与只读的
  2. 利用HAProxy实现零停机更新维护
  3. AJAX推送与拉取方式的比较
  4. linux 重定向 2gt;gt;,编写我自己的linux shell I / O重定向’gt;’函数
  5. 《大型网站技术架构》读书笔记之七:随需应变之网站的可扩展架构
  6. mysql 对库中表授权_对mysql数据库的授权和使用AND案例
  7. Redis4.0 Cluster — Centos7
  8. 华为笔记本linux版电脑管家,一键全解决 华为MateBook电脑管家让您告别电脑烦恼...
  9. 12星座的出生年月日性格_十二星座出生日期
  10. win10家庭版将中文用户名修改为英文
  11. 过程试图写入的管道不存在
  12. java输入输出流_Java学习之输入输出流
  13. 【点云3D目标检测】OpenPCDet下Spconv1.x与Spconv2.x的安装问题及解决方法
  14. 通过浏览器响应实现excel导出
  15. 翻译HoudiniEngine官方文档:PDG
  16. 一个闲鱼挂机项目,让淘宝用户彻底“躺赢”
  17. 软件销售学习的内容畅谈
  18. printf %s打印字符串 出现乱汉字问题解决
  19. 前端工程师需要哪些技能?
  20. Delcam DentCAD v8.1.12 SP2 1CD

热门文章

  1. nsis 安装 vcredist_x86
  2. 葵花宝典:软件开发高手是这样炼成的![转]
  3. IIS-网站报500.19错误代码0x8007000d问题解决
  4. 使用cartopy画飞机的航线
  5. 认知升级 - 第一性原理
  6. 最近整理的Android学习笔记
  7. PAT考试经验总结(甲乙级均适用)~~想满分的请看这里!~~
  8. 2019年年末给我自己的一个总结---发现自己其实外表平静,内心狂野哈哈哈哈哈
  9. 云队友丨任正非内部演讲:星光不问赶路人
  10. 微信公众平台开发(16)--公众号二维码管理