1.练习1 world food facts

2.练习2 chipotle

image.png

数据是这样的

2.1 题目和答案

2.1.1 What is the number of observations in the dataset?

chipo.shape

chipo.info()

注意查看表格的shape 不需要参数

2.1.2 What is the number of columns in the dataset?

chipo.shape[1]

2.1.3 Print the name of all the columns.

chipo.columns

也是不需要参数的

2.1.4 How is the dataset indexed?

chipo.index

2.1.5 Which was the most-ordered item?

c = chipo.groupby('item_name')

c = c.sum()

c = c.sort_values(['quantity'], ascending=False)

c.head(1)

需要复习group by与sum连用; sort_values是排序用的

2.1.6 For the most-ordered item, how many items were ordered?

c = chipo.groupby('item_name')

c = c.sum()

c = c.sort_values(['quantity'], ascending=False)

c.head(1)

按照item_name分组,key就是item_name,再根据分组之后的结果按照quantity排序

2.1.7 What was the most ordered item in the choice_description column?

c = chipo.groupby('choice_description').sum()

c = c.sort_values(['quantity'], ascending=False)

c.head(1)

按照choice_description进行分组,然后根据分组结果按照quantity进行降序排序

2.1.8 How many items were orderd in total?

d=chipo.quantity.sum()

d

求多少东西被买了,求quantity的总和

2.1.9 Turn the item price into a float

chipo.item_price.dtype

dollarizer = lambda x: float(x[1:-1])

chipo.item_price = chipo.item_price.apply(dollarizer)

chipo.item_price.dtype

先查看series的数据类型,然后用lambda创造一个function,apply一下

.astype()也可以进行数据类型转换,就是容易报错

2.1.10 How much was the revenue for the period in the dataset?

revenue = chipo.quantity *chipo.item_price

revenue = revenue.sum()

revenue

2.1.11 How many orders were made in the period?

orders = chipo.order_id.value_counts().count()

orders

value_counts()可以统计不同值,distinct.

count()统计非空值

2.1.12 What is the average revenue amount per order?

chipo['revenue'] = chipo['quantity'] * chipo['item_price']

order_grouped = chipo.groupby(by=['order_id']).sum()

order_grouped.mean()['revenue']

chipo.groupby(by=['order_id']).sum().mean()['revenue']

2.1.13 How many different items are sold?

chipo.item_name.value_counts().count()

python每日一练github_python练习:pandas练习 来自github相关推荐

  1. python 编程一日一练-python每日一练

    广告关闭 2017年12月,云+社区对外发布,从最开始的技术博客到现在拥有多个社区产品.未来,我们一起乘风破浪,创造无限可能. 过滤掉列表中的负数 筛选出字典{lilei: 79,jim: 88,lu ...

  2. Python每日一练0023

    问题 如何判断一个文件是否存在 解决方案 这个问题可以分成几类问题 如果这里的文件指的是文件或目录,我们可以用os.path.exists()方法 >>> import os > ...

  3. Python每日一练0004

    问题 如何保存迭代对象的最后N个元素 例如保存列表['a', 'b', 'c', 'd']的最后2个元素 或者保存某个迭代器对象的最后5个元素 解决方案 对于列表.元组这样的数据结构,可以使用切片来很 ...

  4. python 编程一日一练-Python每日一练0022

    问题 你想在一个文件里每次读入固定大小的字节,比如每次读入4个字节并转成int,或者每次读入x个字节并进行结构化,例如: l = [5, 2, 4, 1, 2, 4, 5, 6, 8] with op ...

  5. python 编程一日一练-Python每日一练0013

    问题 现在有多个字典或者映射,你想将它们从逻辑上合并为一个单一的映射后执行某些操作, 比如查找值或者检查某些键是否存在. 解决方案 使用collections库的ChainMap类,可以快速的将多个d ...

  6. Python每日一练0018

    问题 你需要对浮点数执行精确的计算操作,并且不希望有任何小误差的出现. Python的float类型是存在误差的 >>> a = 1.1 >>> b = 2.2 & ...

  7. python每日一练名片管理程序_Python每日一练0022

    问题 你想在一个文件里每次读入固定大小的字节,比如每次读入4个字节并转成int,或者每次读入x个字节并进行结构化,例如: l = [5, 2, 4, 1, 2, 4, 5, 6, 8] with op ...

  8. Python每日一练第5天——将一组数尽可能均匀地分成两堆,使两个堆中的数的和尽可能相等

    每日一练-做题 麦克叔叔去世了,他在遗嘱中给他的两个孙子阿贝和鲍勃留下了一堆珍贵的口袋妖怪卡片.遗嘱中唯一的方向是"尽可能均匀地分配纸牌的价值".作为Mike遗嘱的执行人,你已经为 ...

  9. Python每日一练(1):计算文件夹内各个文章中出现次数最多的单词

    #coding:utf-8 import os,repath = 'test' files = os.listdir(path)def count_word(words):dic = {}max = ...

最新文章

  1. mybatis脱离项目逆向生成映射文件
  2. 大厂没有方法论(上)
  3. 如何用增长的思维做提效?
  4. Linux - 用户与组
  5. 如何免费获得Gartner关于field Service management各产品魔力象限报告
  6. pdf在html中加载不出来,在网页中打开显示PDF
  7. Postman常用方法
  8. 计算机专业Top20,全国计算机软件专业大学排名TOP20,清华居然不是第一!
  9. lisp文字上标源码_删除重叠文字源码 - AutoLISP/Visual LISP 编程技术 - CAD论坛 - 明经CAD社区 - 源码,程序 - Powered by Discuz!...
  10. Linux上screen命令如何安装,Linux screen命令,Linux screen用法,Linux screen简单用法,Linux screen安装...
  11. 终极算法【2】——终极算法
  12. sku mysql_MySQL-THINKPHP 商城系统二 商品模块的展示
  13. 转速闭环直流调速系统
  14. 云服务器安装不了声卡,驱动精灵怎么安装声卡 声卡驱动安装方法
  15. mac 企业微信,微信,来消息不通知解决方法
  16. 人脸识别,结构光名词记录
  17. 解决Java应用的后台错误:“操作符不存在: character varying = bytea“
  18. notepad++一键删除重复行
  19. iOS---头像选取(照相或者图片库)、大小等比缩放、生成圆形头像
  20. 数据库连接池-c3p0

热门文章

  1. PostgreSQL 14中TOAST的新压缩算法LZ4,它有多快?
  2. Grafana+prometheus实现主机监控
  3. 学习编程可能会走哪些弯路,有哪些经验可以参考?
  4. SaaS应用加速,助力企业应对业务挑战,高效运转
  5. java圆周率祖冲之减法次数_祖冲之是如何计算圆周率的(一)
  6. windows任务栏卡死,重启也没用
  7. 犀牛软件无边框编辑设计,提高模型中的工作速度
  8. zabbix监控服务器
  9. CMake时候出错排查
  10. 随机生成名字c语言代码,CC++实现的游戏角色名称名字随机生成代码(138页)-原创力文档...