pandas下-综合练习
综合练习
- 端午节的淘宝粽子交易
端午节的淘宝粽子交易
(1) 请删除最后一列为缺失值的行,并求所有在杭州发货的商品单价均值。
df=pd.read_csv('F:\Datewheel资料\pandas组队学习\Pandas(下)综合练习数据集\端午粽子数据.csv')
df.head()
df.info()
#查看列名
df.columns()
注意列名中含有空格,后面处理的时候要特别注意。
#删除最后一列为缺失值的行
df_1=df.copy().dropna(axis=0,subset=['发货地址 '])
df_1
#求所有在杭州发货的商品单价均值
pd.to_numeric(df_1[df_1['发货地址 '].str.contains('杭州')][' 价格'],errors='coerce').mean()
(2)商品标题带有“嘉兴”但发货地却不在嘉兴的商品有多少条记录?
df_1[df_1['标题'].str.contains('嘉兴')][~df_1['发货地址 '].str.contains('嘉兴')].shape[0]
(3) 请按照分位数将价格分为“高、较高、中、较低、低” 5 个类别,再将类别结果插入到标题一列之后,最后对类别列进行降序排序。
# 找出不正常的数字
df_1.loc[~df_1[' 价格'].str.match(r'^\d+\.?\d+$')]
df_1[' 价格'].iloc[[538,4376]]=[45.9,45]
df_1[' 价格'] = df_1[' 价格'].astype('float')
df_1['类别'] = pd.qcut(df_1[' 价格'],[0,0.2,0.4,0.6,0.8,1.],labels=['低','较低','中','较高','高'])
df_2 = df_1.reindex(columns=['标题','价格类别',' 价格','付款人数','店铺','发货地址 ']).sort_values('价格类别',ascending=False)
df_2
(4) 付款人数一栏有缺失值吗?若有则请利用上一问的分类结果对这些缺失值进行合理估计并填充。
df_1[df_1['付款人数'].isnull()]
(5)请将数据后四列合并为如下格式的 Series:商品发货地为 ××,店铺为××,共计 ×× 人付款,单价为 ××。
df_3=df_1.astype(str)
s= ('商品发货地为'+df_3['发货地址 ']+',店铺为'+df_3['店铺']+',共计'+df_3['付款人数']+',单价为'+df_3[' 价格']+'。')s
ps:综合练习题目题量太大了,也很难,自己基础不好做起来很吃力,慢慢来吧,加油!
pandas下-综合练习相关推荐
- 双碳目标下综合能源系统低碳运行优化调度Matlab程序
双碳目标下综合能源系统低碳运行优化调度Matlab程序 包含光伏.风电.热电联产.燃气锅炉.电锅炉.电储能.碳捕集设备,考虑碳交易 以系统运行成本最小为目标进行调度 没有具体参考文献,这个只是一个授之 ...
- pandas下boxplot报ZeroDivisionError: integer division or modulo by zero
最近在pandas下画一个箱图boxplot,但是运行起来总是报: ZeroDivisionError: integer division or modulo by zero错误,百思不得其解. 后来 ...
- pandas 学习(二)—— pandas 下的常用函数
import pandas as pd; 1. 数据处理函数 pd.isnull()/pd.notnull():用于检测缺失数据: 2. 辅助函数 pd.to_datetime() 3. Series ...
- Double S 曲线轨迹规划——不同速度加速度条件下综合
目前机械臂常用的轨迹曲线主要是S曲线,由于前后两端速度为抛物线形式,整体相对平滑,具有较好的过渡.程序涵盖了混合轨迹,加速轨迹和减速轨迹,通过设置flag和合理的速度加速度输入值获取双S曲线. 参数的 ...
- 005.python科学计算库pandas(下)
测试数据 fandango_score_comparison.csv series import pandas as pd from pandas import Seriesfandango = pd ...
- Pandas可视化综合指南:手把手从零教你绘制数据图表
晓查 编译整理 量子位 出品 | 公众号 QbitAI 数据可视化本来是一个非常复杂的过程,但随着Pandas数据帧plot()函数的出现,使得创建可视化图形变得很容易. 在数据帧上进行操作的plot ...
- 信号完整性分析大作业_Matplotlib数据可视化 amp; Pandas数据分析 综合实训大作业...
csv文件链接 链接:https://pan.baidu.com/s/1-Q9riIfwTWN1AdV2Fb0eVw 提取码:7stb 1.1设置中文以及负数的编码方式,使得其能够正常显示: # re ...
- pandas 下的 one hot encoder 及 pd.get_dummies() 与 sklearn.preprocessing 下的 OneHotEncoder 的区别
sklearn.preprocessing 下除了提供 OneHotEncoder 还提供 LabelEncoder(简单地将 categorical labels 转换为不同的数字): 1. 简单区 ...
- Pandas Task6——综合练习
第六次-大作业 一.2002 年-2018 年上海机动车拍照拍卖 df_car = pd.read_csv('数据集/2002年-2018年上海机动车拍照拍卖.csv') ##1 df = df_ca ...
最新文章
- pta 哈利·波特的考试
- JS URL 编码 PHP 解码{%u5F00%u53D1}
- 话里话外:流程管理进入2.0时代
- Spring MVC同一方法返回JSON/XML格式
- 四、MyBatis-映射文件
- 目标检测与转自背景减除
- Dijkstra 计算两地间的最短距离
- 第四节:HTML5给表单带来的新标签、新属性、新类型
- c语言 炸弹文件,炸弹超人游戏c语言简板
- Nagios 监控平台快速安装
- 获取今日、本周、本月至今日的所有日期
- Linux(centos)下安装JDK
- 卫星轨道的估计问题(Matlab)(二):扩展卡尔曼滤波(EKF)对新问题的尝试
- 计蒜客 2016计蒜之道比赛 初赛第四场 记录
- html盒子背景图,CSS盒子模型以及背景图
- python中关于object和type的个人理解
- reapair oracle,并行查询的 PX Deq: reap credit 等待
- The client-side rendered virtual DOM tree is not matching server-rendered content. 问题
- 新浪微博--分享到微博的简单使用
- C#中操作Word(6)—— 如何向Word中插入图片