目录

第二章(pandas)

Python从零开始第三章数据处理与分析python中的dplyr(2)

===============================================

filter/select功能

select和drop函数在数据处理中很有用,可以轻松地选择和删除列。这些功能旨在select和drop功能,并可与〜一起使用。

首先,快速了解可用功能:

starts_with(prefix):查找以字符串前缀开头的列。

ends_with(suffix):查找以字符串后缀结尾的列。

contains(substr):查找名称中包含子字符串的列。

everything():所有列。

columns_between(start_col,end_col,inclusive = True):查找指定的开始列和结束列之间的列。包含性布尔关键字参数指示是否应包含结束列。

columns_to(end_col,inclusive = True):获取指定结束列的列。包含参数指示是否应包括结束列。

columns_from(start_col):获取从指定列开始的列。

starts_with()

(diamonds >>

select(starts_with('c')) >>

head(2))

Out[5]:

carat cut color clarity

0 0.23 Ideal E SI2

1 0.21 Premium E SI1

diamonds >> select(~starts_with('c')) >> head(2)

depth table price x y z

0 61.5 55.0 326 3.95 3.98 2.43

1 59.8 61.0 326 3.89 3.84 2.31

contains()

(diamonds >>

select(contains('c')) >>

head(2))

Out[18]:

carat cut color clarity price

0 0.23 Ideal E SI2 326

1 0.21 Premium E SI1 326

columns_from()/columns_to()/columns_between()/columns_between()

diamonds >>head(2)

Out[38]:

carat cut color clarity depth table price x y z

0 0.23 Ideal E SI2 61.5 55.0 326 3.95 3.98 2.43

1 0.21 Premium E SI1 59.8 61.0 326 3.89 3.84 2.31

diamonds >> select(columns_to(X.price)) >> head(2)

Out[39]:

carat cut color clarity depth table

0 0.23 Ideal E SI2 61.5 55.0

1 0.21 Premium E SI1 59.8 61.0

diamonds >> select(columns_from(X.table)) >> head(2)

Out[40]:

table price x y z

0 55.0 326 3.95 3.98 2.43

1 61.0 326 3.89 3.84 2.31

diamonds >> select(columns_between(X.carat,X.table)) >> head(2)

Out[41]:

carat cut color clarity depth table

0 0.23 Ideal E SI2 61.5 55.0

1 0.21 Premium E SI1 59.8 61.0

diamonds >> select(columns_between(X.carat,X.table)) >> head(2)

Out[42]:

carat cut color clarity depth table

0 0.23 Ideal E SI2 61.5 55.0

1 0.21 Premium E SI1 59.8 61.0

row_slice()

可以使用row_slice()函数选择切片行。 可以传递单个整数索引或索引列表来选择行。 这与使用pandas包的的.iloc功能相同。

diamonds >> row_slice([10,15])

carat cut color clarity depth table price x y z

10 0.30 Good J SI1 64.0 55.0 339 4.25 4.28 2.73

15 0.32 Premium E I1 60.9 58.0 345 4.38 4.42 2.68

sample

sample()函数的功能与DataFrames的pandas.sample()方法完全相同。

diamonds >> sample(frac=0.0001, replace=False)

carat cut color clarity depth table price x y z

19736 1.02 Ideal E VS1 62.2 54.0 8303 6.43 6.46 4.01

37159 0.32 Premium D VS2 60.3 60.0 972 4.44 4.42 2.67

1699 0.72 Very Good E VS2 63.8 57.0 3035 5.66 5.69 3.62

20955 1.71 Very Good J VS2 62.6 55.0 9170 7.58 7.65 4.77

5168 0.91 Very Good E SI2 63.0 56.0 3772 6.12 6.16 3.87

diamonds >> sample(n=3, replace=True)

carat cut color clarity depth table price x y z

52892 0.73 Very Good G SI1 60.6 59.0 2585 5.83 5.85 3.54

39454 0.57 Ideal H SI2 62.3 56.0 1077 5.31 5.28 3.30

39751 0.43 Ideal H VVS1 62.3 54.0 1094 4.84 4.85 3.02

distinct()

选择唯一行是使用distinct()完成的。

diamonds >> distinct(X.color)

carat cut color clarity depth table price x y z

0 0.23 Ideal E SI2 61.5 55.0 326 3.95 3.98 2.43

3 0.29 Premium I VS2 62.4 58.0 334 4.20 4.23 2.63

4 0.31 Good J SI2 63.3 58.0 335 4.34 4.35 2.75

7 0.26 Very Good H SI1 61.9 55.0 337 4.07 4.11 2.53

12 0.22 Premium F SI1 60.4 61.0 342 3.88 3.84 2.33

25 0.23 Very Good G VVS2 60.4 58.0 354 3.97 4.01 2.41

28 0.23 Very Good D VS2 60.5 61.0 357 3.96 3.97 2.40

python从2 1 2 2 2 63_Python从零开始第三章数据处理与分析python中的dplyr(2)相关推荐

  1. python中显示第三行数据_Python从零开始第三章数据处理与分析①python中的dplyr(1)...

    前言 我经常使用R的dplyr软件包进行探索性数据分析和数据处理. dplyr除了提供一组可用于解决最常见数据操作问题的一致函数外,dplyr还允许用户使用管道函数编写优雅的可链接的数据操作代码. 现 ...

  2. python每隔半个小时执行一次_一篇文章教你用Python抓取微博评论

    [Part1--理论篇] 试想一个问题,如果我们要抓取某个微博大V微博的评论数据,应该怎么实现呢?最简单的做法就是找到微博评论数据接口,然后通过改变参数来获取最新数据并保存.首先从微博api寻找抓取评 ...

  3. 《Python语言程序设计》王恺 机械工业出版社 第三章课后习题答案

    ​​第三章   函数 3.7 课后习题 (1)在Python语言中,使用函数分为两个步骤:定义函数和调用函数 (2)在Python语言中,函数定义需要使用def关键字 (3)形参是在定义函数时函数后面 ...

  4. 第三章 ArcGIS Pro创建 python 脚本工具(五)

    其实整个第三章介绍的内容很少,真正的实验步骤,一节左右就可以概述处理,只是原书作者对于基础与一些信息都给了介绍,所以内容才会显得较多.关于新建自定义脚本工具,我觉得简单的来说,步骤就是创建脚本(如何写 ...

  5. python基础第三章选择结构答案-Python days03-选择结构【if】

    编程基础:程序结构 通常情况下,代码为了模拟生活中的处理问题的方式/步骤,出现程序运行结构 1.顺序结构:按照从上到下的顺序,逐行解释执行代码! 2.选择结构:模拟生活中的选择条件,根据条件的结果来执 ...

  6. python3编写人工智能_人工智能学习第三章 编写第一个Python程序 及概念

    接下来我们将看见如何在 Python 中运行一个传统的"Hello World"程序. 本章将会教你如何编写.保存与运行 Python 程序. 通过 Python 来运行的你的程序 ...

  7. python目标跟踪精度曲线图_目标跟踪配置(三)-评价指标-benchmark(更新中,关注请收藏。。。)...

    目标跟踪基础与智能前沿 关注上方公众号,回复下方安装过程中对应关键字,获得对应安装包. 本文持续更新中- 连载可关注知乎专栏"目标跟踪基础与前沿" 文章目录 [ 目标跟踪基础与智能 ...

  8. 【深度学习入门:基于Python的理论与实现】书本学习笔记 第三章 神经网络

    文章目录 1. 阶跃函数的实现 2. 函数图形 2.1 阶跃函数 2.2 sigmoid 函数 2.3 ReLU 函数 3. 多维数组的运算 3.1 矩阵乘法 3.2 神经网络的内积 4. 三层神经网 ...

  9. 《python编程快速上手 让繁琐工作自动化》第三章习题+实践答案

    习题 1.为什么在程序中加入函数会有好处? 答:函数减少了重复的代码.这让程序更短,更容易阅读,更容易修改 2.函数中的代码何时执行:在函数被定义时,还是在函数被调用时? 答:函数中的代码在函数被调用 ...

最新文章

  1. MOOON-scheduler核心设计图(初稿)
  2. (译)如何用命令行在windows Azure上安装负载平衡的web Farm虚拟机(linux或其他)...
  3. webuploader结合php实现图片上传到本地和保存数据库
  4. 最邻近插值法(The nearest interpolation)实现图像缩放
  5. AtCoder AGC038D Unique Path (图论)
  6. Django系列目录
  7. windows to go 命令行模式建立
  8. js 控制超出字数显示省略号
  9. Zabbix的简单使用
  10. 官方正式预热小米10S:哈曼卡顿加持小米有史以来音质最好的手机
  11. 里的type_拥有Type-C接口等于拥有PD快充?当然不是!
  12. 疯狂挂载:Linux连接常用外部设备的方法
  13. vue2.0实现银行卡类型种类的选择
  14. 8.4文件系统的管理与挂载2
  15. mysql数据类型及占用字节数
  16. 上海电力大学计算机科学与技术学院,栗风永 - 上海电力大学 - 计算机科学与技术学院...
  17. 通过TCP网络协议实现控制台多人聊天功能,另附私聊@功能。(java)
  18. dataframe.append()合并多个列名相同的文件
  19. 应用程序无法运行,不是有效的Win32位程序解决(新手向)
  20. React Native version mismatch

热门文章

  1. Newsgroups数据集介绍
  2. 【转】小木虫分享免费文献获得方法
  3. [转]Decide.com是怎么做商品价格预测的
  4. [原创] Jenkins slave agent 分布式构建
  5. java 输出helloword
  6. 一次清空所有数据方法
  7. memcache/redis 缓存学习笔记
  8. 【原创】利用typeface实现不同字体的调用显示及String转换为Unicode
  9. WIN7下访问ftp的方法
  10. (转)CKEditor和CKFinder在ASP.NET中的应用