一、Pandas基础
主要内容是文件的读写、学习Series和DataFrame两种数据结构、常用函数(汇总、特征统计、唯一值、替换、排序、apply)以及窗口对象
其中窗口对象的内容借助图表的形式有助于理解rolling、shift、diff、pct_change

二、练习题

1、汇总函数的使用
df_demo = df[[‘HP’, ‘Attack’,‘Defense’,‘Sp. Atk’,‘Sp. Def’,‘Speed’]]
df_demo.apply(lambda x:x.sum(), axis=1)==df[‘Total’]

2、a
df_2 =df.drop_duplicates(’#’,keep=‘first’)
df_2[‘Type 1’].nunique()
df_2[‘Type 1’].value_counts().head(3)

2、b
df_2.drop_duplicates([‘Type 1’,‘Type 2’],keep=‘first’) 143个组合

df_2.drop_duplicates([‘Type 1’,‘Type 2’],keep=False) 40个组合
keep=False 所有重复组合的行进行了剔除

Q:表示保留只出现过一次的组合吗?
2.c
计算:Type1与Type2的所有组合减掉上一小题的所有组合
Q: 不能拼成字符串

同样的:L_part = [i+’ ‘+j for i, j in zip(df[‘Type 1’], df[‘Type 2’])]也会有问题

True: L_part = [i+’ '+j for i, j in zip(df[‘Type 1’], df[‘Type 2’].replace(np.nan, ‘’))]可以实现,由此可见replace(np.nan, ‘’)是将格式进行统一的关键,np.nan是一个float类型的数据.
最后用:res = set(L_full).difference(set(L_part)) 进行删减

3、a

s1=df[‘Attack’]
s1.mask(s1>120,‘high’).mask(s1<50,‘low’) 可以运行
s1.mask(s1>120,‘high’).mask(s1<50,‘low’).mask(s1<=120 & s1>=50,‘mid’) 报错
参考答案:df[‘Attack’].mask(df[‘Attack’]>120, ‘high’).mask(df[‘Attack’]<50, ‘low’).mask((50<=df[‘Attack’])&(df[‘Attack’]<=120), ‘mid’)

3、b
1)replace方法

2)apply

s2.apply(lambda x:str.upper(x))

3、c
numpy模块下的median作用为:计算沿指定轴的均值,返回数组元素的均值.

df[‘statistics’]=df[[‘HP’,‘Attack’, ‘Defense’, ‘Sp. Atk’, ‘Sp. Def’, ‘Speed’]].apply(lambda x:np.max((x-x.median()).abs()),axis=1)
df[‘statistics’].sort_values(ascending=False)
df.sort_values(‘statistics’,ascending=False)

第二个大题还需要时间去琢磨。

DW_Pandas_Task2相关推荐

最新文章

  1. 嵌入式中的中断服务程序
  2. blue html中转换,Vue/Vue中Html和Markdown互相转换/README.md · bluemoon/LearningNotes - Gitee.com...
  3. AjaxPro.dll和AjaxPro.2.dll的web配置方法
  4. flask mysql orm,flask的orm框架(Flask-SQLAlchemy)-创建表
  5. 安装jdk时更改java安装路径_JDK下载安装步骤
  6. MfC基础--绘图基础--win32
  7. c语言代码大全表解释_C语言解惑圈子更新(20191201)
  8. 机器学习笔记之概率图模型(五)马尔可夫随机场的结构表示
  9. php采标教程,国内液压与气动行业标准大全
  10. 计算机桌面文件能单独设密码吗,告诉你怎么给文件夹设置密码
  11. [BJDCTF2020]Mark loves cat详细解法与思路
  12. Navicat 快捷键大全
  13. Mysql Schema优化
  14. Java温习——表达式expression
  15. 读取远程服务器上文件内容,读取远程服务器上的文件
  16. 如何获客:3招做好触客营销实现高效获
  17. Git 2.38发布,引入巨型仓库管理工具Scalar
  18. 用matlab实现熵权法,熵权法原理及matlab代码实现
  19. 赋予DBLINK权限
  20. Unity3D学习笔记——RigidBody(刚体)

热门文章

  1. 阿里云提示安全组与 VPC 不匹配问题解决方案
  2. 一键采集多个卷皮网商品主图及细节图并保存到同一目录
  3. 13.数据中台-数据自助分析系统
  4. d3服务器不稳定,d3服务器
  5. JPG和PNG深度对比解析
  6. 什么是资产阶级思想?
  7. 使用傲梅分区助手迁移系统以及避坑指南
  8. BUUCTF RSA4(中国剩余定理)
  9. hibernate 和 jpa简介
  10. 两代人拼13年购商品房 房产证认人不认钱