Python 数据分析练习1:美国人口数据分析
需求:导入文件,查看原始数据,将美国各州人口数据和简称合并,去掉重复的一列。合并各州面积数据,找到2010年的全民人口数据,计算各州的人口密度,排序,找到人口密度最高的州。
链接:https://pan.baidu.com/s/1VmWnvVkgL0QalnoCrQCEfg
提取码:qgxu
表1:州名和简称
表2:各州各时间、各年龄段人口
表3:各州面积
----------------------------------------------------
----------------------------------------------------
----------------------------------------------------
import pandas as pddf_abbrevs = pd.read_csv("state-abbrevs.csv")
df_population = pd.read_csv("state-population.csv")
df_usa = pd.merge(df_abbrevs, df_population, left_on="abbreviation", right_on="state/region")
print(df_usa)
df_usa = df_usa.drop("abbreviation", axis=1)
print(df_usa)
df_area = pd.read_csv("state-areas.csv")
df_usa = pd.merge(df_usa, df_area, on="state")
print(df_usa)
df_usa_2010 = df_usa[df_usa.loc[:, "year"] == 2010].loc[:,["state", "population", "area (sq. mi)"]]
print(df_usa_2010)
df_usa_2010 = pd.pivot_table(df_usa_2010, index="state", values=["population", "area (sq. mi)"], aggfunc="sum")
df_usa_2010["area (sq. mi)"] = df_usa_2010["area (sq. mi)"]/2
df_usa_2010["density"] = df_usa_2010.apply(lambda x: x["population"] / x["area (sq. mi)"], axis=1)
print(df_usa_2010)
df_usa_2010 = df_usa_2010.sort_values(by="density", axis=0)
print(df_usa_2010)
df_usa_2010.iloc[-1, :]
print(df_usa_2010)
Python 数据分析练习1:美国人口数据分析相关推荐
- 美国各州人口数据分析
案例分析:美国各州人口数据分析 - 需求:- 导入文件,查看原始数据- 将人口数据和各州简称数据进行合并- 将合并的数据中重复的abbreviation列进行删除- 查看存在缺失数据的列- 找到有哪些 ...
- 【数据分析day03】美国各州人口数据分析
案例分析:美国各州人口数据分析
- pandas 案例分析:美国各州人口数据分析
案例分析:美国各州人口数据分析 首先导入文件,并查看数据样本 In [54]: abbr = pd.read_csv("./usapop/state-abbrevs.csv") a ...
- 利用python进行数据分析-14.5 2012美国大选数据分析(基础复习)
美国大选数据分析 导入数据及相关库 数据清洗 填充缺失值 数据转换 面元化数据(分桶) 数据聚合与分组运算 时间处理 str转datetime(datetime为时间序列数据类型) 重新采样和频率转换 ...
- Python技术栈与Spark交叉数据分析双向整合技术实战--大数据ML样本集案例实战
版权声明:本套技术专栏是作者(秦凯新)平时工作的总结和升华,通过从真实商业环境抽取案例进行总结和分享,并给出商业应用的调优建议和集群环境容量规划等内容,请持续关注本套博客.QQ邮箱地址:1120746 ...
- python 数据分析学什么-从零开始学数据分析,什么程度可以找工作?
我是爱神的飞刀: 转行到数据行业差不多一个月了,才敢来回答这个问题,其中各种心酸.无助真不是能用语言能表达的,下面我尽可能的详细的说说,希望对接下来想转行的朋友有帮助. 我是2016年6月毕业的控制工 ...
- python初级数据分析师薪资_学会数据分析,薪资翻倍?!
信息爆炸的时代,数据分析行业异常火爆,倍受众多人才的青睐.数据分析火爆的原因就是由于数据分析这一行业具有未来的前瞻性,正因为如此使得数据分析具有了十分广阔的前景. 其实,大部分人还不了解数据分析行业, ...
- [Python从零到壹] 十一.数据分析之Numpy、Pandas、Matplotlib和Sklearn入门知识万字详解(1)
欢迎大家来到"Python从零到壹",在这里我将分享约200篇Python系列文章,带大家一起去学习和玩耍,看看Python这个有趣的世界.所有文章都将结合案例.代码和作者的经验讲 ...
- python实习生面试题_大数据分析实习生面试题库
原标题:大数据分析实习生面试题库 大数据分析是一个有吸引力的领域,因为它不仅有利可图,而且您有机会从事有趣的项目,而且您总是在学习新事物.如果您想从头开始,请查看大数据分析实习生面试题库以准备面试要点 ...
- python中ndarray对象实例化_Python数据分析之Numpy学习 2——NumPy 基础 ndarray对象
Python数据分析之Numpy学习 2 -- NumPy 基础学习 NumPy(Numerical Python)是高性能科学计算和数据分析的基础包.NumPy的主要对象是同构数据多维容器(homo ...
最新文章
- mac webpack 版本_晓前端周刊 第48期:EMP面向未来微前端方案正式开源了!玩转 webpack,使你的打包速度提升 90%;...
- zoj 1698 Easier Done Than Said?
- 设计模式 — 结构型模式 — 外观模式
- 什么叫预判_什么才是真正的用户画像?
- 因为我的名字特殊大家都是用异样的眼光在看着我 04
- 计算机分php,计算机按照处理数据的形态分类,可以分为什么?
- 炸锅了!阿里Ant Design前端框架的圣诞彩蛋事件
- 信息学奥赛C++语言:判断正负
- C++文件操作(打开、关闭、文件读取数据存入数组)
- 图像局部特征(八)--斑点检测子SIFT/SURF区别总结
- 搜索引擎技术揭密:网络蜘蛛
- 简单记录 03.21
- 51单片机入门-1-最小系统基础概念
- 知名建筑景观3D可视化渲染软件lumion10.5
- Opencvchina网站:把证件照蓝色背景转为白色
- 阴阳师2017 7服务器维护,《阴阳师》手游4月17日维护更新公告
- Icon图标 [Java]
- 源支付3.1版本全开源版+店员监控软件+手机监控APP源码
- 如何解决 使用matplotlib.finance获取雅虎财经网站股票数据 报错?
- win10解决你当前无权访问该文件夹,拒绝你访问该文件夹