数据采集习题参考答案，会持续更新，点个关注防丢失。

创作不易，一键三连给博主一个支持呗。

为了方便查找，已按照头歌重新排版，朋友们按照头歌所属门类查找实训哦，该篇为Pandas。

文章目录

实训一：Pandas初体验

第一关：了解数据处理对象--Series

编程要求

Pandas中的数据结构

第一关答案

第二关：了解数据处理对象-DataFrame

编程要求

相关知识

第二关答案

第三关：读取CSV格式数据

编程要求

相关知识

第三关答案

第四关：数据的基本操作——排序

编程要求

相关知识

第四关答案

第五关：数据的基本操作——删除

编程要求

相关知识

第五关答案

第六关：数据的基本操作——算术运算

编程要求

相关知识

第六关答案

第七关：数据的基本操作——去重

编程要求

相关知识

第七关答案

第八关：层次化索引

编程要求

相关知识

第八关答案

实训一：Pandas初体验

第一关：了解数据处理对象--Series

编程要求

创建一个名为series_a的series数组，当中值为[1,2,5,7],对应的索引为['nu', 'li', 'xue', 'xi']；

创建一个名为dict_a的字典，字典中包含如下内容{'ting':1, 'shuo':2, 'du':32, 'xie':44}；

将dict_a字典转化成名为series_b的series数组。

相关知识

Pandas是为了解决数据分析任务而创建的，纳入了大量的库和标准数据模型，提供了高效地操作大型数据集所需的工具。对于Pandas包，在Python中常见的导入方法如下：

from pandas import Series,DataFrame

import pandas as pd

Pandas中的数据结构

Series: 一维数组，类似于Python中的基本数据结构list，区别是Series只允许存储相同的数据类型，这样可以更有效的使用内存，提高运算效率。就像数据库中的列数据；
DataFrame: 二维的表格型数据结构。很多功能与R中的data.frame类似。可以将DataFrame理解为Series的容器；
Panel：三维的数组，可以理解为DataFrame的容器。

了解Series

为了开始使用Pandas，我们必需熟悉它的两个重要的数据结构：Series 和DataFrame。虽然它们不是每一个问题的通用解决方案，但可以提供一个坚实的，易于使用的大多数应用程序的基础。 Series是一个一维的类似的数组对象，包含一个数组的数据（任何NumPy的数据类型）和一个与数组关联的数据标签，被叫做索引。最简单的Series是由一个数组的数据构成：

In [1]:obj=Series([4,7,-5,3])
In [2]:obj
Out[2]:
0 4
1 7
2 -5
3 3

Series的交互式显示的字符串表示形式是索引在左边，值在右边。因为我们没有给数据指定索引，一个包含整数0到N-1这里N是数据的长度）的默认索引被创建。你可以分别的通过它的values和index属性来获取 Series的数组表示和索引对象：

In [3]: obj.values
Out[3]:array([4,7,-5,3])
In [4]: obj.index
Out[4]:Int64Index([0,1,2,3])

通常，需要创建一个带有索引来确定每一个数据点的Series。

In [5]:obj2=Series([4,7,-5,3],index=['d','b','a','c'])
In [6]:obj2
Out[6]:
d 4
b 7
a -5
c 3

如果你有一些数据在一个Python字典中，你可以通过传递字典来从这些数据创建一个Series，只传递一个字典的时候，结果Series中的索引将是排序后的字典的键。

第一关答案

# -*- coding: utf-8 -*-
from pandas import Series,DataFrame
import  pandas as pddef create_series():'''返回值:series_a: 一个Series类型数据series_b: 一个Series类型数据dict_a：  一个字典类型数据'''# 请在此添加代码 完成本关任务# ********** Begin *********#series_a=Series([1,2,5,7],index=['nu','li','xue','xi'])dict_a={'ting':1,'shuo':2,'du':32,'xie':44}series_b=Series(dict_a)# ********** End **********## 返回series_a,dict_a,series_breturn series_a,dict_a,series_b

第二关：了解数据处理对象-DataFrame

编程要求

创建一个五行三列的名为df1的DataFrame数组，列名为 [states,years,pops]，行名['one','two','three','four','five']；

给df1添加新列，列名为new_add，值为[7,4,5,8,2]。

第二关答案

# -*- coding: utf-8 -*-
from pandas import Series,DataFrame
import  pandas as pddef create_dataframe():'''返回值:df1: 一个DataFrame类型数据'''# 请在此添加代码 完成本关任务# ********** Begin *********#data={'states':['Ohio','Ohio','Ohio','Nevada','Nevada'],'years':[2000,2001,2002,2001,2002],'pops':[1.5,1.7,3.6,2.4,2.9]}df1=DataFrame(data,index=['one','two','three','four','five'])df1['new_add'] = [7,4,5,8,2]# ********** End **********##返回df1return df1

第三关：读取CSV格式数据

编程要求

将test3/uk_rain_2014.csv中的数据导入到df1中；

将列名修改为['water_year','rain_octsep','outflow_octsep','rain_decfeb', 'outflow_decfeb', 'rain_junaug', 'outflow_junaug']；

计算df1的总行数并存储在length1中。

第三关答案

# -*- coding: utf-8 -*-
from pandas import Series,DataFrame
import  pandas as pd
def read_csv_data():'''返回值:df1: 一个DataFrame类型数据length1: 一个int类型数据'''# 请在此添加代码 完成本关任务# ********** Begin *********#df1=pd.read_csv('test3/uk_rain_2014.csv', header=0,encoding = 'gbk')df1.columns = ['water_year','rain_octsep','outflow_octsep','rain_decfeb', 'outflow_decfeb', 'rain_junaug', 'outflow_junaug']length1=len(df1)# ********** End **********##返回df1,length1return df1,length1

第四关：数据的基本操作——排序

编程要求

对代码中s1进行按索引排序，并将结果存储到s2；

对代码中d1进行按值排序（index为f），并将结果存储到d2。

第四关答案

# -*- coding: utf-8 -*-
from pandas import Series,DataFrame
import  pandas as pd
def sort_gate():'''返回值:s2: 一个Series类型数据d2: 一个DataFrame类型数据'''# s1是Series类型数据，d1是DataFrame类型数据s1 = Series([4, 3, 7, 2, 8], index=['z', 'y', 'j', 'i', 'e'])d1 = DataFrame({'e': [4, 2, 6, 1], 'f': [0, 5, 4, 2]})# 请在此添加代码 完成本关任务# ********** Begin *********#s2=s1.sort_index()d2=d1.sort_values(by='f')# ********** End **********##返回s2,d2return s2,d2

第五关：数据的基本操作——删除

编程要求

在s1中删除z行，并赋值到s2；

d1中删除yy列，并赋值到d2。

第五关答案

# -*- coding: utf-8 -*-
from pandas import Series,DataFrame
import numpy as np
import  pandas as pddef delete_data():'''返回值:s2: 一个Series类型数据d2: 一个DataFrame类型数据'''# s1是Series类型数据，d1是DataFrame类型数据s1 = Series([5, 2, 4, 1], index=['v', 'x', 'y', 'z'])d1=DataFrame(np.arange(9).reshape(3,3), columns=['xx','yy','zz'])# 请在此添加代码 完成本关任务# ********** Begin *********#s2=s1.drop('z')d2=d1.drop(['yy'],axis=1)# ********** End **********## 返回s2,d2return s2, d2

第六关：数据的基本操作——算术运算

编程要求

让df1与df2相加得到df3，并设置默认填充值为4。

第六关答案

# -*- coding: utf-8 -*-
from pandas import Series,DataFrame
import numpy as np
import  pandas as pddef add_way():'''返回值:df3: 一个DataFrame类型数据'''# df1,df2是DataFrame类型数据df1 = DataFrame(np.arange(12.).reshape((3, 4)), columns=list('abcd'))df2 = DataFrame(np.arange(20.).reshape((4, 5)), columns=list('abcde'))# 请在此添加代码 完成本关任务# ********** Begin *********#df3=df1.add(df2,fill_value=4)# ********** End **********## 返回df3return df3

第七关：数据的基本操作——去重

编程要求

去除df1中重复的行，并把结果保存到df2中。

第七关答案

# -*- coding: utf-8 -*-
from pandas import Series,DataFrame
import  pandas as pddef delete_duplicated():'''返回值:df2: 一个DataFrame类型数据'''# df1是DataFrame类型数据df1 = DataFrame({'k1': ['one'] * 3 + ['two'] * 4, 'k2': [1, 1, 2, 3, 3, 4, 4]})# 请在此添加代码 完成本关任务# ********** Begin *********#df2=df1.drop_duplicates()# ********** End **********## 返回df2return df2

第八关：层次化索引

编程要求

对s1进行数据重塑，转化成DataFrame类型，并复制到d1。

第八关答案

# -*- coding: utf-8 -*-
from pandas import Series,DataFrame
import  pandas as pd
import numpy as np
def suoying():'''返回值:d1: 一个DataFrame类型数据'''#s1是Series类型数据s1=Series(np.random.randn(10),index=[['a', 'a', 'a', 'b', 'b', 'b', 'c', 'c', 'd', 'd'], [1, 2, 3, 1, 2, 3, 1, 2, 2, 3]])# 请在此添加代码 完成本关任务# ********** Begin *********#d1=s1.unstack()# ********** End **********## 返回d1return d1suoying()

数据采集习题参考答案，会持续更新，点个关注防丢失。

创作不易，一键三连给博主一个支持呗。

数据采集与清洗基础习题（四）Pandas初体验，头歌参考答案相关推荐

Pandas初体验——头歌平台答案
第1关了解数据处理对象--Series # -*- coding: utf-8 -*- from pandas import Series,DataFrame import pandas as pd ...
两万字详细爬虫知识储备，数据采集与清洗基础习题（一）头歌参考答案
数据采集习题参考答案,会持续更新,点个关注防丢失.为了方便寻找,按照头歌的门类从新整理了实训的分类,朋友们记得看标题哦,按标题寻找! 该篇为爬虫知识储备! 文章目录实训一:HTML基础第一关:初识 ...
数据采集与清洗基础习题（二）Python爬虫常用模块，头歌参考答案
数据采集习题参考答案,会持续更新,点个关注防丢失.为了方便查找,已按照头歌重新排版,朋友们按照头歌所属门类查找实训哦,该篇为Python爬虫常用模块. 创作不易,一键三连给博主一个支持呗. 文章目录 ...
Python学习笔记：pandas初体验
Python学习笔记:pandas初体验一.安装pandas模块 1.安装Python3.7 注意:必须勾选pip(python install package). 2.配置环境变量 3.下载 pa ...
python初体验-hello world答案_Python基础学习之Python初体验
一．前期准备对于python的学习,首先的有一个硬件电脑,软件python的运行环境.说了一句废话,对于很多初学者而言,安装运行环境配置环境变量的什么的各种头疼,常常在第一步就被卡死了,对于pyth ...
python内置函数用来打开或创建文件_2020年《python程序设计》基础知识及程序设计598题XS[含参考答案]...
2020年<python程序设计>基础知识及程序设计 598题[含参考答案] 一.填空题 1．表达式 len('中国'.encode('utf-8')) 的值为___________.(6 ...
aic准则python_2020年《python程序设计》基础知识及程序设计598题AIC[含参考答案]
2020 年< python 程序设计>基础知识及程序设计 598 题 [ 含参考答案 ] 一.填空题 1 ．表达式 len('abcdefg'.ljust(3)) 的值为 ______ ...
python数列求和1+11+111前n项_2020年《python程序设计》基础知识及程序设计598题IQ[含参考答案]...
2020年<python程序设计>基础知识及程序设计 598题[含参考答案] 一.填空题 1．表达式 len('abc'.ljust(20)) 的值为______________.(20) ...
python中、不论类的名字是什么、构造方法的名字都是( )_2020年《python程序设计》基础知识及程序设计598题GA[含参考答案]...
2020年<python程序设计>基础知识及程序设计 598题[含参考答案] 一.填空题 1．表达式 len('abcdefg'.ljust(3)) 的值为_________.(7) 2． ...
Java基础学习之hibernate初体验
Hibernate 简介 : 简介: Hibernate 是由 Gavin King 于 2001 年创建的开放源代码的对象关系框架.它强大且高效的构建具有关系对象持久性和查询服务的 Java 应用程 ...

数据采集与清洗基础习题（四）Pandas初体验，头歌参考答案

实训一：Pandas初体验

第一关：了解数据处理对象--Series

编程要求

Pandas中的数据结构

第一关答案

第二关：了解数据处理对象-DataFrame

编程要求

相关知识

第二关答案

第三关：读取CSV格式数据

编程要求

相关知识

第三关答案

第四关：数据的基本操作——排序

编程要求

相关知识

第四关答案

第五关：数据的基本操作——删除

编程要求

相关知识

第五关答案

第六关：数据的基本操作——算术运算

编程要求

相关知识

第六关答案

第七关：数据的基本操作——去重

编程要求

相关知识

第七关答案

第八关：层次化索引

编程要求

相关知识

第八关答案

数据采集与清洗基础习题（四）Pandas初体验，头歌参考答案相关推荐

最新文章

热门文章