美国警方致命枪击案数据可视化分析 上
import numpy as np # linear algebra
import pandas as pd # data processing, CSV file I/O (e.g. pd.read_csv)
import seaborn as sns
import matplotlib.pyplot as plt
from collections import Counter# 输入数据文件可在"input/" 目录
# For example, running this (by clicking run or pressing Shift+Enter) will list the files in the input directoryfrom subprocess import check_output# Any results you write to the current directory are saved as output.median_house_hold_in_come = pd.read_csv('input/MedianHouseholdIncome2015.csv', encoding="windows-1252")
percentage_people_below_poverty_level = pd.read_csv('input/PercentagePeopleBelowPovertyLevel.csv', encoding="windows-1252")
percent_over_25_completed_highSchool = pd.read_csv('input/PercentOver25CompletedHighSchool.csv', encoding="windows-1252")
share_race_city = pd.read_csv('input/ShareRaceByCity.csv', encoding="windows-1252")
kill = pd.read_csv('input/PoliceKillingsUS.csv', encoding="windows-1252")print(percentage_people_below_poverty_level.head())
print(percentage_people_below_poverty_level.info())
print(percentage_people_below_poverty_level['Geographic Area'].unique())percentage_people_below_poverty_level.poverty_rate.replace(['-'],0.0,inplace = True)
percentage_people_below_poverty_level.poverty_rate = percentage_people_below_poverty_level.poverty_rate.astype(float)
area_list = list(percentage_people_below_poverty_level['Geographic Area'].unique())
area_poverty_ratio = []
for i in area_list:x = percentage_people_below_poverty_level[percentage_people_below_poverty_level['Geographic Area']==i]area_poverty_rate = sum(x.poverty_rate)/len(x)area_poverty_ratio.append(area_poverty_rate)
data = pd.DataFrame({'area_list': area_list,'area_poverty_ratio':area_poverty_ratio})
new_index = (data['area_poverty_ratio'].sort_values(ascending=False)).index.values
sorted_data = data.reindex(new_index)# visualization
plt.figure(figsize=(15,10))
sns.barplot(x=sorted_data['area_list'], y=sorted_data['area_poverty_ratio'])
plt.xticks(rotation= 45)
plt.xlabel('States')
plt.ylabel('Poverty Rate')
plt.title('Poverty Rate Given States')
plt.show()print(kill.head())separate = kill.name[kill.name != 'TK TK'].str.split()
a,b = zip(*separate)
name_list = a+b
name_count = Counter(name_list)
most_common_names = name_count.most_common(15)
x,y = zip(*most_common_names)
x,y = list(x),list(y)plt.figure(figsize=(15,10))
ax= sns.barplot(x=x, y=y,palette = sns.cubehelix_palette(len(x)))
plt.xlabel('Name or Surname of killed people')
plt.ylabel('Frequency')
plt.title('Most common 15 Name or Surname of killed people')
plt.show()
想获取python学习资料的小伙伴可以加QQ:728711576
美国警方致命枪击案数据可视化分析 上相关推荐
- Python数据分析实战,,美国总统大选数据可视化分析[基于pandas]
目录 前言 一.任务详情 二.数据集来源 三.实现过程 四.运行代码 前言 在学习Python数据分析的过程中,是离不开实战的. 今天跟大家带来数据分析可视化经典项目,美国总统大选数据可视化分析,希望 ...
- 基于pyecharts的Kline以及pandas对美国标准普尔500指数历史数据(SP500)进行数据可视化分析
基于pyecharts的Kline以及pandas对美国标准普尔500指数历史数据(SP500)进行数据可视化分析 k线图简述 对股票数据的描述,我们最常用的还是k线图,k线图包含四个数据,即开盘价. ...
- 大数据可视化分析以及预测性分析方法
摘要:大数据分析要实现的应用领域之一就是预测性分析,可视化分析和数据挖掘都是前期铺垫工作,只要在大数据中挖掘出信息的特点与联系,就可以建立科学的数据模型,通过模型带入新的数据,从而预测未来的数据. 大 ...
- TableauBDP,哪个才是最适合中国用户的数据可视化分析工具?
作者:pledge 本人数据分析师一枚,除了工作所需,自己对数据分析.数据可视化的产品工具都比较感兴趣,喜欢混迹于各种数据论坛,也发现和使用了不少数据工具,也积累了很多亲身经历.这两年数据可视化在国内 ...
- NBA球星数据可视化分析-FineBI
目录 一.实验(实训)目的 二.实验(实训)原理或方法 三.仪器设备.材料 四.实验(实训)步骤 五.实训记录及结果 <---------------------------------木易白驹 ...
- Kaggle Lending Club Loan Data数据可视化分析与不良贷款预测
文章目录 数据集介绍 数据可视化分析前的数据预处理 引入包和数据集 对特征缺失值的处理 保存处理好的数据集 数据可视化分析 申请贷款金额和实际贷款金额的数据分布 每年贷款笔数直方图与每年贷款总金额直方 ...
- GIS大数据可视化分析工具
俗话说的好:工欲善其事,必先利其器!一款好的工具可以让你事半功倍,尤其是在大数据时代,更需要强有力的工具通过使数据有意义的方式实现数据可视化,还有数据的可交互性:我们还需要跨学科的团队,而不是单个数据 ...
- GIS+=地理信息+大数据技术——GIS大数据可视化分析工具
题记 俗话说的好:工欲善其事,必先利其器!一款好的工具可以让你事半功倍,尤其是在大数据时代,更需要强有力的工具通过使数据有意义的方式实现数据可视化,还有数据的可交互性:我们还需要跨学科的团队,而不是单 ...
- 数据可视化分析案例:探索BRFSS电话调查数据
原文链接:http://tecdat.cn/?p=9284 加载包 library(tidyr) library(knitr) opts_chunk$set(echo = TRUE, fig.alig ...
最新文章
- SQL中IN与EXISTS的比较
- Ardino基础教程 10_光控声音
- java 解析docx_java解析xlsx和docx 文件 | 学步园
- 【报告分享】2020-2021虎嗅洞察报告:聚焦私域流量,洞察增长变局.pdf(附下载链接)...
- 谷歌 kaptcha 图片验证码
- 打补丁更新不适用计算机,安装补丁“此更新不适用于你的计算机”解决办法
- 最新PHP扩展SG11解密教程分享+视频模式
- 3d打印实用小工具--GCode Viewer在线预览GCODE文件
- .Net Core Pdf 转图片
- 使用Fiddler抓取安卓手机APP链接
- 以技术入股物流细分领域,是对赌还是协同发展?--专访握物流CEO欧阳铭
- 【支付】银行卡支付的行为主体介绍
- 微信步数日历打卡小程序
- macbook linux 双系统,MacBook Air (13-inch, 2017)(8+128G)安装Ubuntu18.04双系统
- SAAS产品有哪些优缺点?
- 格式化代码_格式化代码是什么意思
- 计算机网络 — VLAN
- vs15 preview5 离线安装包
- AS400一些有用的命令
- screenshot python_python 截图screenshot处理
热门文章
- OneNote安装代码高亮插件-NoteHightlight(2010-2013-2016)
- python苹果李子橙_Python 炫技操作:安装包的八种方法
- neo4j图数据入门(二)数据的插入和删除 图形界面操作 图文并茂
- 超市商品管理系统(c语言)
- python计算存款复利计算器_GitHub - dxcv/Options-Calculator: 期权价格计算器——金融工程第二次展示...
- AI大行其道,你准备好了吗?—谨送给徘徊于转行AI的程序员
- keras实现手写数字识别
- 信息学奥赛培训python吗
- GTA5mod整合版游戏 超清画质+800辆真车+179添加人物
- 天池比赛-01-用随机森林进行信贷违约预测-Baseline