利用Pandas库进行简单的数据规整

Pandas练习4-数据规整

练习题
- 练习1
- 练习2
- 练习3
- 练习4
练习1
- 代码
- 效果图
练习2
- 代码
- 效果图
练习3
- 代码
- 效果图
练习4
- 代码
- 效果图
小结

练习题

练习1

练习2

练习3

练习4

练习1

代码

import pandas as pd
# Exercise 1
# 通过starbucks_store_worldwide.csv数据，分析星巴克在中国分布多还是美国分布多？
# 将 Country 设成 行索引 去匹配 CN(中国)和US(美国)
starbucks_data = pd.read_csv("starbucks_store_worldwide.csv", index_col=["Country"])
# print(starbucks_data.columns)
# 通过上行代码得知 columns有 'Brand', 'Store Number', 'Store Name', 'Ownership Type',
# 'Street Address', 'City', 'State/Province', 'Postcode', 'Phone Number',
# 'Timezone', 'Longitude', 'Latitude'
# 利用Store Number来计算商店的数量 因为每一个星巴克有自己独特的Store Number
China_number = starbucks_data.loc["CN"]["Store Number"].count()
USA_number = starbucks_data.loc["US"]["Store Number"].count()
print("中国星巴克的数量：", China_number)
print("美国星巴克的数量：", USA_number)
if China_number > USA_number:print("星巴克在中国分布多")
elif China_number < USA_number:print("星巴克在美国分布多")
elif China_number == USA_number:print("星巴克在中国和美国分布一样多")print()

效果图

练习2

代码

# Exercise 2
# 通过starbucks_store_worldwide.csv数据，获取中国每个省份的分布数量
starbucks_in_China_of_each_province = starbucks_data.loc["CN"].groupby(by="State/Province")["Store Number"].count()
details_starbucks_in_China = starbucks_data.loc["CN"].groupby(by=["State/Province", "City"])["Store Number"].count()
print("各个省份（省份由数字表示）星巴克的总数（前十个省份）：")
print(starbucks_in_China_of_each_province.head(10))
print()
print("各个省份不同城市的星巴克数量：")
print(details_starbucks_in_China)
print()

效果图

练习3

代码

# Exercise 3
# 将 学生成绩表 与 选修成绩表 进行水平拼接
# 将 名字 那一列设置为行索引
student_grades = pd.read_excel("学生成绩表.xlsx", index_col=[0])
optional_courses_grades = pd.read_excel("选修成绩表.xlsx", index_col=[0])
# 利用DataFrame的 join()方法做一个内连接即可
result_table = student_grades.join(optional_courses_grades, how="inner")
print(result_table)
print()

效果图

练习4

代码

# Exercise 4
# 将 学生分配表.xlsx 和 老师排班表.xlsx 结合
# 需求：想在一张表中直观的了解每一位同学对应的老师
# 把每个表格的行索引定位 班级
student_distributions = pd.read_excel("学生分配表.xlsx", index_col="班级")
teachers_classes = pd.read_excel("老师排班表.xlsx", index_col="班级")
# 使用merge()方法进行一个内连接即可
class_table = pd.merge(student_distributions, teachers_classes, on="班级", how="inner")
print(class_table)

效果图

小结

分析一个文件的数据时，首先要观察数据来获取可以利用的行索引和列索引。
merge()和concat()是pandas的方法，join()是DataFrame的方法。
要灵活运用groupby(by=key)、索引以及分层索引去取值和将数据分组。

利用Pandas库进行简单的数据规整相关推荐

利用Pandas库进行简单的数据分析（数据清洗）
Pandas练习3 练习题练习1 练习2 练习1 代码效果图练习2 代码效果图小结练习题练习1 练习2 练习1 代码 import pandas as pd import numpy a ...
利用pandas库中的read_html方法快速抓取网页中常见的表格型数据
利用pandas库中的read_html方法快速抓取网页中常见的表格型数据本文转载自:https://www.makcyun.top/web_scraping_withpython2.html 需要 ...
python如何安装panda数据库_在Pycharm中安装Pandas库方法(简单易懂)
开发环境的搭建是一件入门比较头疼的事情,在上期的文稿基础上,增加一项Anaconda的安装介绍.Anaconda是Python的一个发行版本,安装好了Anaconda就相当于安装好了Python,并且 ...
利用pcl库实现简单单帧障碍物检测
利用pcl库实现简单单帧障碍物检测 #include <iostream> #include <pcl/common/common_headers.h> #include &l ...
利用PCL库从点云数据生成深度图像及关键点提取
利用PCL库从点云数据生成生成深度图像及关键点提取利用PCL库从点云数据生成深度图像及关键点提取本想利用标准点云数据库分割成若干块,利用标准点云数据生成深度图像作为数据库用来验证算法,目前效果不是 ...
DS之信息挖掘：利用pandas库统计某一列col中各个值出现的次数(降序输出)
DS之信息挖掘:利用pandas库统计某一列col中各个值出现的次数(降序输出) 目录利用pandas库统计某一列col中各个值出现的次数(降序输出) 输出结果实现代码利用pandas库统计某一 ...
利用PCL库做简单的三维立体图形
利用PCL库画简单的三维立体图形需要知道各种图形的参数方程,然后给每个参数赋值便可以. 圆柱面的参数方程为:x = R*cos(θ); y = R*sin(θ); z = z;其中 θ范围是[-2*P ...
python导入excel模块_Excel到python第一章python利用pandas和numpy模块导入数据
原博文 2019-08-29 21:18 − import numpy as np import pandas as pd # 导入数据 # 读取csv数据 df = pd.read_csv(open ...
python用pandas读取excel_浅谈python之利用pandas和openpyxl读取excel数据
在学接口自动化测试时, 需要从excel中读取测试用例的数据, 假如我的数据是这样的: 最好是每行数据对应着一条测试用例, 为方便取值, 我选择使用pandas库, 先安装 pip install p ...

利用Pandas库进行简单的数据规整

Pandas练习4-数据规整

练习题

练习1

练习2

练习3

练习4

练习1

代码

效果图

练习2

代码

效果图

练习3

代码

效果图

练习4

代码

效果图

小结

利用Pandas库进行简单的数据规整相关推荐

最新文章

热门文章