import numpy as np # linear algebra
import pandas as pd # data processing, CSV file I/O (e.g. pd.read_csv)
import seaborn as sns
import matplotlib.pyplot as plt
from collections import Counter# 输入数据文件可在"input/" 目录
# For example, running this (by clicking run or pressing Shift+Enter) will list the files in the input directoryfrom subprocess import check_output# Any results you write to the current directory are saved as output.median_house_hold_in_come = pd.read_csv('input/MedianHouseholdIncome2015.csv', encoding="windows-1252")
percentage_people_below_poverty_level = pd.read_csv('input/PercentagePeopleBelowPovertyLevel.csv', encoding="windows-1252")
percent_over_25_completed_highSchool = pd.read_csv('input/PercentOver25CompletedHighSchool.csv', encoding="windows-1252")
share_race_city = pd.read_csv('input/ShareRaceByCity.csv', encoding="windows-1252")
kill = pd.read_csv('input/PoliceKillingsUS.csv', encoding="windows-1252")print(percentage_people_below_poverty_level.head())
print(percentage_people_below_poverty_level.info())
print(percentage_people_below_poverty_level['Geographic Area'].unique())percentage_people_below_poverty_level.poverty_rate.replace(['-'],0.0,inplace = True)
percentage_people_below_poverty_level.poverty_rate = percentage_people_below_poverty_level.poverty_rate.astype(float)
area_list = list(percentage_people_below_poverty_level['Geographic Area'].unique())
area_poverty_ratio = []
for i in area_list:x = percentage_people_below_poverty_level[percentage_people_below_poverty_level['Geographic Area']==i]area_poverty_rate = sum(x.poverty_rate)/len(x)area_poverty_ratio.append(area_poverty_rate)
data = pd.DataFrame({'area_list': area_list,'area_poverty_ratio':area_poverty_ratio})
new_index = (data['area_poverty_ratio'].sort_values(ascending=False)).index.values
sorted_data = data.reindex(new_index)# visualization
plt.figure(figsize=(15,10))
sns.barplot(x=sorted_data['area_list'], y=sorted_data['area_poverty_ratio'])
plt.xticks(rotation= 45)
plt.xlabel('States')
plt.ylabel('Poverty Rate')
plt.title('Poverty Rate Given States')
plt.show()print(kill.head())separate = kill.name[kill.name != 'TK TK'].str.split()
a,b = zip(*separate)
name_list = a+b
name_count = Counter(name_list)
most_common_names = name_count.most_common(15)
x,y = zip(*most_common_names)
x,y = list(x),list(y)plt.figure(figsize=(15,10))
ax= sns.barplot(x=x, y=y,palette = sns.cubehelix_palette(len(x)))
plt.xlabel('Name or Surname of killed people')
plt.ylabel('Frequency')
plt.title('Most common 15 Name or Surname of killed people')
plt.show()

想获取python学习资料的小伙伴可以加QQ:728711576​​​​​​​

美国警方致命枪击案数据可视化分析 上相关推荐

  1. Python数据分析实战,,美国总统大选数据可视化分析[基于pandas]

    目录 前言 一.任务详情 二.数据集来源 三.实现过程 四.运行代码 前言 在学习Python数据分析的过程中,是离不开实战的. 今天跟大家带来数据分析可视化经典项目,美国总统大选数据可视化分析,希望 ...

  2. 基于pyecharts的Kline以及pandas对美国标准普尔500指数历史数据(SP500)进行数据可视化分析

    基于pyecharts的Kline以及pandas对美国标准普尔500指数历史数据(SP500)进行数据可视化分析 k线图简述 对股票数据的描述,我们最常用的还是k线图,k线图包含四个数据,即开盘价. ...

  3. 大数据可视化分析以及预测性分析方法

    摘要:大数据分析要实现的应用领域之一就是预测性分析,可视化分析和数据挖掘都是前期铺垫工作,只要在大数据中挖掘出信息的特点与联系,就可以建立科学的数据模型,通过模型带入新的数据,从而预测未来的数据. 大 ...

  4. TableauBDP,哪个才是最适合中国用户的数据可视化分析工具?

    作者:pledge 本人数据分析师一枚,除了工作所需,自己对数据分析.数据可视化的产品工具都比较感兴趣,喜欢混迹于各种数据论坛,也发现和使用了不少数据工具,也积累了很多亲身经历.这两年数据可视化在国内 ...

  5. NBA球星数据可视化分析-FineBI

    目录 一.实验(实训)目的 二.实验(实训)原理或方法 三.仪器设备.材料 四.实验(实训)步骤 五.实训记录及结果 <---------------------------------木易白驹 ...

  6. Kaggle Lending Club Loan Data数据可视化分析与不良贷款预测

    文章目录 数据集介绍 数据可视化分析前的数据预处理 引入包和数据集 对特征缺失值的处理 保存处理好的数据集 数据可视化分析 申请贷款金额和实际贷款金额的数据分布 每年贷款笔数直方图与每年贷款总金额直方 ...

  7. GIS大数据可视化分析工具

    俗话说的好:工欲善其事,必先利其器!一款好的工具可以让你事半功倍,尤其是在大数据时代,更需要强有力的工具通过使数据有意义的方式实现数据可视化,还有数据的可交互性:我们还需要跨学科的团队,而不是单个数据 ...

  8. GIS+=地理信息+大数据技术——GIS大数据可视化分析工具

    题记 俗话说的好:工欲善其事,必先利其器!一款好的工具可以让你事半功倍,尤其是在大数据时代,更需要强有力的工具通过使数据有意义的方式实现数据可视化,还有数据的可交互性:我们还需要跨学科的团队,而不是单 ...

  9. 数据可视化分析案例:探索BRFSS电话调查数据

    原文链接:http://tecdat.cn/?p=9284 加载包 library(tidyr) library(knitr) opts_chunk$set(echo = TRUE, fig.alig ...

最新文章

  1. SQL中IN与EXISTS的比较
  2. Ardino基础教程 10_光控声音
  3. java 解析docx_java解析xlsx和docx 文件 | 学步园
  4. 【报告分享】2020-2021虎嗅洞察报告:聚焦私域流量,洞察增长变局.pdf(附下载链接)...
  5. 谷歌 kaptcha 图片验证码
  6. 打补丁更新不适用计算机,安装补丁“此更新不适用于你的计算机”解决办法
  7. 最新PHP扩展SG11解密教程分享+视频模式
  8. 3d打印实用小工具--GCode Viewer在线预览GCODE文件
  9. .Net Core Pdf 转图片
  10. 使用Fiddler抓取安卓手机APP链接
  11. 以技术入股物流细分领域,是对赌还是协同发展?--专访握物流CEO欧阳铭
  12. 【支付】银行卡支付的行为主体介绍
  13. 微信步数日历打卡小程序
  14. macbook linux 双系统,MacBook Air (13-inch, 2017)(8+128G)安装Ubuntu18.04双系统
  15. SAAS产品有哪些优缺点?
  16. 格式化代码_格式化代码是什么意思
  17. 计算机网络 — VLAN
  18. vs15 preview5 离线安装包
  19. AS400一些有用的命令
  20. screenshot python_python 截图screenshot处理

热门文章

  1. OneNote安装代码高亮插件-NoteHightlight(2010-2013-2016)
  2. python苹果李子橙_Python 炫技操作:安装包的八种方法
  3. neo4j图数据入门(二)数据的插入和删除 图形界面操作 图文并茂
  4. 超市商品管理系统(c语言)
  5. python计算存款复利计算器_GitHub - dxcv/Options-Calculator: 期权价格计算器——金融工程第二次展示...
  6. AI大行其道,你准备好了吗?—谨送给徘徊于转行AI的程序员
  7. keras实现手写数字识别
  8. 信息学奥赛培训python吗
  9. GTA5mod整合版游戏 超清画质+800辆真车+179添加人物
  10. 天池比赛-01-用随机森林进行信贷违约预测-Baseline