需求:导入文件,查看原始数据,将美国各州人口数据和简称合并,去掉重复的一列。合并各州面积数据,找到2010年的全民人口数据,计算各州的人口密度,排序,找到人口密度最高的州。

链接:https://pan.baidu.com/s/1VmWnvVkgL0QalnoCrQCEfg
提取码:qgxu

表1:州名和简称

表2:各州各时间、各年龄段人口

表3:各州面积

----------------------------------------------------

----------------------------------------------------

----------------------------------------------------

import pandas as pddf_abbrevs = pd.read_csv("state-abbrevs.csv")
df_population = pd.read_csv("state-population.csv")
df_usa = pd.merge(df_abbrevs, df_population, left_on="abbreviation", right_on="state/region")
print(df_usa)
df_usa = df_usa.drop("abbreviation", axis=1)
print(df_usa)
df_area = pd.read_csv("state-areas.csv")
df_usa = pd.merge(df_usa, df_area, on="state")
print(df_usa)
df_usa_2010 = df_usa[df_usa.loc[:, "year"] == 2010].loc[:,["state", "population", "area (sq. mi)"]]
print(df_usa_2010)
df_usa_2010 = pd.pivot_table(df_usa_2010, index="state", values=["population", "area (sq. mi)"], aggfunc="sum")
df_usa_2010["area (sq. mi)"] = df_usa_2010["area (sq. mi)"]/2
df_usa_2010["density"] = df_usa_2010.apply(lambda x: x["population"] / x["area (sq. mi)"], axis=1)
print(df_usa_2010)
df_usa_2010 = df_usa_2010.sort_values(by="density", axis=0)
print(df_usa_2010)
df_usa_2010.iloc[-1, :]
print(df_usa_2010)

Python 数据分析练习1:美国人口数据分析相关推荐

  1. 美国各州人口数据分析

    案例分析:美国各州人口数据分析 - 需求:- 导入文件,查看原始数据- 将人口数据和各州简称数据进行合并- 将合并的数据中重复的abbreviation列进行删除- 查看存在缺失数据的列- 找到有哪些 ...

  2. 【数据分析day03】美国各州人口数据分析

    案例分析:美国各州人口数据分析

  3. pandas 案例分析:美国各州人口数据分析

    案例分析:美国各州人口数据分析 首先导入文件,并查看数据样本 In [54]: abbr = pd.read_csv("./usapop/state-abbrevs.csv") a ...

  4. 利用python进行数据分析-14.5 2012美国大选数据分析(基础复习)

    美国大选数据分析 导入数据及相关库 数据清洗 填充缺失值 数据转换 面元化数据(分桶) 数据聚合与分组运算 时间处理 str转datetime(datetime为时间序列数据类型) 重新采样和频率转换 ...

  5. Python技术栈与Spark交叉数据分析双向整合技术实战--大数据ML样本集案例实战

    版权声明:本套技术专栏是作者(秦凯新)平时工作的总结和升华,通过从真实商业环境抽取案例进行总结和分享,并给出商业应用的调优建议和集群环境容量规划等内容,请持续关注本套博客.QQ邮箱地址:1120746 ...

  6. python 数据分析学什么-从零开始学数据分析,什么程度可以找工作?

    我是爱神的飞刀: 转行到数据行业差不多一个月了,才敢来回答这个问题,其中各种心酸.无助真不是能用语言能表达的,下面我尽可能的详细的说说,希望对接下来想转行的朋友有帮助. 我是2016年6月毕业的控制工 ...

  7. python初级数据分析师薪资_学会数据分析,薪资翻倍?!

    信息爆炸的时代,数据分析行业异常火爆,倍受众多人才的青睐.数据分析火爆的原因就是由于数据分析这一行业具有未来的前瞻性,正因为如此使得数据分析具有了十分广阔的前景. 其实,大部分人还不了解数据分析行业, ...

  8. [Python从零到壹] 十一.数据分析之Numpy、Pandas、Matplotlib和Sklearn入门知识万字详解(1)

    欢迎大家来到"Python从零到壹",在这里我将分享约200篇Python系列文章,带大家一起去学习和玩耍,看看Python这个有趣的世界.所有文章都将结合案例.代码和作者的经验讲 ...

  9. python实习生面试题_大数据分析实习生面试题库

    原标题:大数据分析实习生面试题库 大数据分析是一个有吸引力的领域,因为它不仅有利可图,而且您有机会从事有趣的项目,而且您总是在学习新事物.如果您想从头开始,请查看大数据分析实习生面试题库以准备面试要点 ...

  10. python中ndarray对象实例化_Python数据分析之Numpy学习 2——NumPy 基础 ndarray对象

    Python数据分析之Numpy学习 2 -- NumPy 基础学习 NumPy(Numerical Python)是高性能科学计算和数据分析的基础包.NumPy的主要对象是同构数据多维容器(homo ...

最新文章

  1. mac webpack 版本_晓前端周刊 第48期:EMP面向未来微前端方案正式开源了!玩转 webpack,使你的打包速度提升 90%;...
  2. zoj 1698 Easier Done Than Said?
  3. 设计模式 — 结构型模式 — 外观模式
  4. 什么叫预判_什么才是真正的用户画像?
  5. 因为我的名字特殊大家都是用异样的眼光在看着我 04
  6. 计算机分php,计算机按照处理数据的形态分类,可以分为什么?
  7. 炸锅了!阿里Ant Design前端框架的圣诞彩蛋事件
  8. 信息学奥赛C++语言:判断正负
  9. C++文件操作(打开、关闭、文件读取数据存入数组)
  10. 图像局部特征(八)--斑点检测子SIFT/SURF区别总结
  11. 搜索引擎技术揭密:网络蜘蛛
  12. 简单记录 03.21
  13. 51单片机入门-1-最小系统基础概念
  14. 知名建筑景观3D可视化渲染软件lumion10.5
  15. Opencvchina网站:把证件照蓝色背景转为白色
  16. 阴阳师2017 7服务器维护,《阴阳师》手游4月17日维护更新公告
  17. Icon图标 [Java]
  18. 源支付3.1版本全开源版+店员监控软件+手机监控APP源码
  19. 如何解决 使用matplotlib.finance获取雅虎财经网站股票数据 报错?
  20. win10解决你当前无权访问该文件夹,拒绝你访问该文件夹

热门文章

  1. cubieboard开发板简介
  2. Android集成高德地图实现自定义Marker
  3. 计算机二级新年来临贺卡步骤,2021新年贺卡怎么做步骤图片
  4. 磁盘被写保护无法使用怎么办?
  5. matlab彩色图像处理实验报告,matlab简单图像处理实验报告
  6. 盘点免费好用的5款思维导图工具
  7. 【老九学堂】【初识C语言】编码规范
  8. 信息系统项目管理师(2022年)—— 重点内容:知识产权与标准规范(22)
  9. ZYNQ系列(一) Petalinux建立工程
  10. android 音频转mp3格式,音频 (六)- 安卓 ndk 将 pcm 转换为 mp3