综合练习

  • 端午节的淘宝粽子交易

端午节的淘宝粽子交易

(1) 请删除最后一列为缺失值的行,并求所有在杭州发货的商品单价均值。

df=pd.read_csv('F:\Datewheel资料\pandas组队学习\Pandas(下)综合练习数据集\端午粽子数据.csv')
df.head()

df.info()

#查看列名
df.columns()


注意列名中含有空格,后面处理的时候要特别注意。

#删除最后一列为缺失值的行
df_1=df.copy().dropna(axis=0,subset=['发货地址 '])
df_1

#求所有在杭州发货的商品单价均值
pd.to_numeric(df_1[df_1['发货地址 '].str.contains('杭州')][' 价格'],errors='coerce').mean()


(2)商品标题带有“嘉兴”但发货地却不在嘉兴的商品有多少条记录?

df_1[df_1['标题'].str.contains('嘉兴')][~df_1['发货地址 '].str.contains('嘉兴')].shape[0]


(3) 请按照分位数将价格分为“高、较高、中、较低、低” 5 个类别,再将类别结果插入到标题一列之后,最后对类别列进行降序排序。

# 找出不正常的数字
df_1.loc[~df_1[' 价格'].str.match(r'^\d+\.?\d+$')]

df_1[' 价格'].iloc[[538,4376]]=[45.9,45]
df_1[' 价格'] = df_1[' 价格'].astype('float')
df_1['类别'] = pd.qcut(df_1[' 价格'],[0,0.2,0.4,0.6,0.8,1.],labels=['低','较低','中','较高','高'])
df_2 = df_1.reindex(columns=['标题','价格类别',' 价格','付款人数','店铺','发货地址 ']).sort_values('价格类别',ascending=False)
df_2


(4) 付款人数一栏有缺失值吗?若有则请利用上一问的分类结果对这些缺失值进行合理估计并填充。

df_1[df_1['付款人数'].isnull()]


(5)请将数据后四列合并为如下格式的 Series:商品发货地为 ××,店铺为××,共计 ×× 人付款,单价为 ××。

df_3=df_1.astype(str)
 s= ('商品发货地为'+df_3['发货地址 ']+',店铺为'+df_3['店铺']+',共计'+df_3['付款人数']+',单价为'+df_3[' 价格']+'。')s

ps:综合练习题目题量太大了,也很难,自己基础不好做起来很吃力,慢慢来吧,加油!

pandas下-综合练习相关推荐

  1. 双碳目标下综合能源系统低碳运行优化调度Matlab程序

    双碳目标下综合能源系统低碳运行优化调度Matlab程序 包含光伏.风电.热电联产.燃气锅炉.电锅炉.电储能.碳捕集设备,考虑碳交易 以系统运行成本最小为目标进行调度 没有具体参考文献,这个只是一个授之 ...

  2. pandas下boxplot报ZeroDivisionError: integer division or modulo by zero

    最近在pandas下画一个箱图boxplot,但是运行起来总是报: ZeroDivisionError: integer division or modulo by zero错误,百思不得其解. 后来 ...

  3. pandas 学习(二)—— pandas 下的常用函数

    import pandas as pd; 1. 数据处理函数 pd.isnull()/pd.notnull():用于检测缺失数据: 2. 辅助函数 pd.to_datetime() 3. Series ...

  4. Double S 曲线轨迹规划——不同速度加速度条件下综合

    目前机械臂常用的轨迹曲线主要是S曲线,由于前后两端速度为抛物线形式,整体相对平滑,具有较好的过渡.程序涵盖了混合轨迹,加速轨迹和减速轨迹,通过设置flag和合理的速度加速度输入值获取双S曲线. 参数的 ...

  5. 005.python科学计算库pandas(下)

    测试数据 fandango_score_comparison.csv series import pandas as pd from pandas import Seriesfandango = pd ...

  6. Pandas可视化综合指南:手把手从零教你绘制数据图表

    晓查 编译整理 量子位 出品 | 公众号 QbitAI 数据可视化本来是一个非常复杂的过程,但随着Pandas数据帧plot()函数的出现,使得创建可视化图形变得很容易. 在数据帧上进行操作的plot ...

  7. 信号完整性分析大作业_Matplotlib数据可视化 amp; Pandas数据分析 综合实训大作业...

    csv文件链接 链接:https://pan.baidu.com/s/1-Q9riIfwTWN1AdV2Fb0eVw 提取码:7stb 1.1设置中文以及负数的编码方式,使得其能够正常显示: # re ...

  8. pandas 下的 one hot encoder 及 pd.get_dummies() 与 sklearn.preprocessing 下的 OneHotEncoder 的区别

    sklearn.preprocessing 下除了提供 OneHotEncoder 还提供 LabelEncoder(简单地将 categorical labels 转换为不同的数字): 1. 简单区 ...

  9. Pandas Task6——综合练习

    第六次-大作业 一.2002 年-2018 年上海机动车拍照拍卖 df_car = pd.read_csv('数据集/2002年-2018年上海机动车拍照拍卖.csv') ##1 df = df_ca ...

最新文章

  1. pta 哈利·波特的考试
  2. JS URL 编码 PHP 解码{%u5F00%u53D1}
  3. 话里话外:流程管理进入2.0时代
  4. Spring MVC同一方法返回JSON/XML格式
  5. 四、MyBatis-映射文件
  6. 目标检测与转自背景减除
  7. Dijkstra 计算两地间的最短距离
  8. 第四节:HTML5给表单带来的新标签、新属性、新类型
  9. c语言 炸弹文件,炸弹超人游戏c语言简板
  10. Nagios 监控平台快速安装
  11. 获取今日、本周、本月至今日的所有日期
  12. Linux(centos)下安装JDK
  13. 卫星轨道的估计问题(Matlab)(二):扩展卡尔曼滤波(EKF)对新问题的尝试
  14. 计蒜客 2016计蒜之道比赛 初赛第四场 记录
  15. html盒子背景图,CSS盒子模型以及背景图
  16. python中关于object和type的个人理解
  17. reapair oracle,并行查询的 PX Deq: reap credit 等待
  18. The client-side rendered virtual DOM tree is not matching server-rendered content. 问题
  19. 新浪微博--分享到微博的简单使用
  20. C#中操作Word(6)—— 如何向Word中插入图片

热门文章

  1. java实现自动售货机
  2. UOS 1050e ARM架构(linux)安装TP-LINK TL-WN823N免驱版无线网卡驱动
  3. SpringBoot OA自动化办公系统
  4. 【Linux】环境变量和命令行参数
  5. mysql 创建外键语句_sql创建外键语句
  6. Python 实现发红包
  7. 初识RPC中间件zeroC ICE工具之iceca
  8. 网络偷窥者很多,如何消除上网的浏览痕迹?
  9. 多领域常见的一种NB-IoT温湿度传感器
  10. 防范客户流失的主要措施有哪些?