美国大选献金项目学习笔记
目录
- 要求
- 代码:
要求
代码:
import numpy as np
import pandas as pddf = pd.read_csv('./data/usa_election.txt')# 异常值处理删除捐款数<=0的数据
df['contb_receipt_amt'] <= 0 #捐款数<=0的数据
df.loc[df['contb_receipt_amt'] <= 0]
indexs = df.loc[df['contb_receipt_amt'] <= 0].index
df.drop(labels=indexs,inplace=True)#新建一列为候选人所在党派party
parties = {'Bachmann, Michelle':'Republican','Romney, Mitt':'Republican','Obama, Barack':'Democrat',"Roemer, Charles E. 'Buddy' III":'Reform','Pawlenty, Timothy':'Republican','Johnson, Gary Earl':'Libertarian','Paul, Ron':'Republican','Santorum, Rick':'Republican','Cain, Herman':'Republican','Gingrich, Newt':'Republican','McCotter, Thaddeus G':'Republican','Huntsman, Jon':'Republican','Perry, Rick':'Republican'}
df['party'] = df['cand_nm'].map(parties)
#查看有多少党派(party)
df['party'].unique()
# 统计party列中各元素出现的频率
df['party'].value_counts()# 查看各党派政治献金总金额(contb_receipt_amt)
df.groupby(by='party')['contb_receipt_amt'].sum()# 查看每天各党派政治献金总金额(contb_receipt_amt)
df.groupby(by=['contb_receipt_dt','party'])['contb_receipt_amt'].sum()#将日期转换为中文格式:年-月-日
months = {'JAN':1,'FEB':2,'MAR':3,'APR':4,'MAY':5,'JUN':6,'JUL':7,'AUG':8,'SEP':9,'OCT':10,'NOV':11,'DEC':12}
def Date_change(d):day,month,year = d.split('-')month = months[month]#将英文月份转换为中文月份return '20'+year+'-'+str(month)+'-'+day
df['contb_receipt_dt'] = df['contb_receipt_dt'].map(Date_change)#查看老兵(捐献者职业)DISABLED VETERAN主要捐赠对象
#取出老兵这个职业对应的数据
df['contbr_occupation'] == 'DISABLED VETERAN'
df_old = df.loc[df['contbr_occupation'] == 'DISABLED VETERAN']#分组:以候选人分组,对捐赠金额求和
df_old.groupby(by='cand_nm')['contb_receipt_amt'].sum()
美国大选献金项目学习笔记相关推荐
- 2012美国大选献金项目数据分析
文章目录 1.数据载入与预览 1.1 数据加载 1.2 数据合并 1.3 数据预览 1.3.1 查看是否有空值 1.3.2用统计学指标快速描述数值型属性的概要 2.数据的预处理 2.1 数据清洗 2. ...
- 【数据分析】使用pandas和numpy分析美国大选献金项目
1. 数据载入与总览 1.1 数据加载 #绘图工具 import matplotlib.pyplot as plt %matplotlib inline #数据处理工具 import numpy as ...
- 2012美国大选献金项目(最详细解释)
1. 数据载入和总览 import numpy as npimport pandas as pdfrom pandas import Series,DataFrame 1.1 数据载入 df1 = p ...
- 数据分析---2012美国大选献金项目数据分析
需求: 1. 加载数据 df = pd.read_csv('./data/usa_election.txt') 2. 对新数据进行总览,查看是否存在缺失数据: 方法一:isnull.notnull.a ...
- 3 Python数据分析 美国各州人口分析案例 Pandas高级操作 美国大选献金案例 matplotlib
Python数据分析 1 案例 美国各州人口分析 1.1 数据介绍 数据来源:https://github.com/jakevdp/data-USstates/ 1.1.1 州人口数量表 state- ...
- 项目3:美国大选献金目数据分析
""" 需求: 1.读取数据 2.查看是否有缺失数据 3.用统计学指标快速描述数值型属性的概要 4.空值处理.可能因为忘记填写保密等原因,相关字段出现了空值,将其填充为N ...
- TheBeerHouse 网站项目学习笔记(5)---架构设计
前述讨论: TheBeerHouse 网站项目学习笔记(1)----换肤技术 TheBeerHouse 网站项目学习笔记(2)----个性化管理 ...
- 尚医通项目学习笔记Part1
尚医通项目学习笔记 前言 一.目前学习进度 二.学习记录 1.项目简介 1.1 项目所会用到的技术栈 1.2 业务流程 2.项目学习笔记 2.1MyBatis-Plus相关 2.2搭建项目框架 2.3 ...
- 炼数成金Tensorflow学习笔记之2.2_变量
炼数成金Tensorflow学习笔记之2.2_变量 代码及分析 代码及分析 import tensorflow as tfx = tf.Variable([1, 2]) a = tf.constant ...
最新文章
- Nginx proxy_cache 使用示例
- 01-mybatis源码阅读
- 10所“双一流”入选!一批国家自然科学基金立项名单公示
- Ubuntu 10.10从零开始建立android 2.2 froyo开发环境
- 【Java基本功】一文读懂String及其包装类的实现原理
- mysql 查询不为0的数据_查询数据库中所有记录总数不为0的数据表名称
- 迷茫在路口——致我的2014
- 基于Taro开发小程序笔记--04路由跳转的几种方式
- 3dtiles加载调度原理分析
- LeetCode 242 Valid Anagram
- bootstrap4 图标和文字行内对齐
- java field setfont_java高手请进!
- 技术原理丨超高精准度IP地址定位这样实现
- python 网络小说爬取2
- GOT-10k: A Large High-Diversity Benchmark forGeneric Object Tracking in the Wild(论文翻译)
- 单元格的边框没有被显示出来
- Qt控件边框颜色设定
- 数据结构--伸展树(伸展树构建二叉搜索树)-学习笔记
- python编程:从入门到实践习题第五章5-8~5-11
- 模拟器,预览,自动预览,自动真机调试有用,扫二维码真机调试报错
热门文章
- 驱动新手指南(帮助)
- android 群控 网络 adb,安卓群控.sln · hhhooo/结合mini和adb命令,和adb socket实现安卓群控 - Gitee.com...
- 图大杀猫:数据可视化的真善美
- C#之汉诺塔的移动步骤显示算法
- golang物联网_使用golang谷歌云平台和grafana监控物联网设备
- 印象笔记mac版 同步问题_mac版印象笔记 升级 导致 未同步的笔记丢失
- Sketch(二)——图标集画微信图标
- Python中赋值的含义
- React Native 学习笔记六(关于宽高的设置)
- Mitsubishi/三菱Q系列PLC ,QD77MS16走总线控制伺服项目,实际应用的,程序结构清晰明了