python从2 1 2 2 2 63_Python从零开始第三章数据处理与分析python中的dplyr(2)
目录
第二章(pandas)
Python从零开始第三章数据处理与分析python中的dplyr(2)
===============================================
filter/select功能
select和drop函数在数据处理中很有用,可以轻松地选择和删除列。这些功能旨在select和drop功能,并可与〜一起使用。
首先,快速了解可用功能:
starts_with(prefix):查找以字符串前缀开头的列。
ends_with(suffix):查找以字符串后缀结尾的列。
contains(substr):查找名称中包含子字符串的列。
everything():所有列。
columns_between(start_col,end_col,inclusive = True):查找指定的开始列和结束列之间的列。包含性布尔关键字参数指示是否应包含结束列。
columns_to(end_col,inclusive = True):获取指定结束列的列。包含参数指示是否应包括结束列。
columns_from(start_col):获取从指定列开始的列。
starts_with()
(diamonds >>
select(starts_with('c')) >>
head(2))
Out[5]:
carat cut color clarity
0 0.23 Ideal E SI2
1 0.21 Premium E SI1
diamonds >> select(~starts_with('c')) >> head(2)
depth table price x y z
0 61.5 55.0 326 3.95 3.98 2.43
1 59.8 61.0 326 3.89 3.84 2.31
contains()
(diamonds >>
select(contains('c')) >>
head(2))
Out[18]:
carat cut color clarity price
0 0.23 Ideal E SI2 326
1 0.21 Premium E SI1 326
columns_from()/columns_to()/columns_between()/columns_between()
diamonds >>head(2)
Out[38]:
carat cut color clarity depth table price x y z
0 0.23 Ideal E SI2 61.5 55.0 326 3.95 3.98 2.43
1 0.21 Premium E SI1 59.8 61.0 326 3.89 3.84 2.31
diamonds >> select(columns_to(X.price)) >> head(2)
Out[39]:
carat cut color clarity depth table
0 0.23 Ideal E SI2 61.5 55.0
1 0.21 Premium E SI1 59.8 61.0
diamonds >> select(columns_from(X.table)) >> head(2)
Out[40]:
table price x y z
0 55.0 326 3.95 3.98 2.43
1 61.0 326 3.89 3.84 2.31
diamonds >> select(columns_between(X.carat,X.table)) >> head(2)
Out[41]:
carat cut color clarity depth table
0 0.23 Ideal E SI2 61.5 55.0
1 0.21 Premium E SI1 59.8 61.0
diamonds >> select(columns_between(X.carat,X.table)) >> head(2)
Out[42]:
carat cut color clarity depth table
0 0.23 Ideal E SI2 61.5 55.0
1 0.21 Premium E SI1 59.8 61.0
row_slice()
可以使用row_slice()函数选择切片行。 可以传递单个整数索引或索引列表来选择行。 这与使用pandas包的的.iloc功能相同。
diamonds >> row_slice([10,15])
carat cut color clarity depth table price x y z
10 0.30 Good J SI1 64.0 55.0 339 4.25 4.28 2.73
15 0.32 Premium E I1 60.9 58.0 345 4.38 4.42 2.68
sample
sample()函数的功能与DataFrames的pandas.sample()方法完全相同。
diamonds >> sample(frac=0.0001, replace=False)
carat cut color clarity depth table price x y z
19736 1.02 Ideal E VS1 62.2 54.0 8303 6.43 6.46 4.01
37159 0.32 Premium D VS2 60.3 60.0 972 4.44 4.42 2.67
1699 0.72 Very Good E VS2 63.8 57.0 3035 5.66 5.69 3.62
20955 1.71 Very Good J VS2 62.6 55.0 9170 7.58 7.65 4.77
5168 0.91 Very Good E SI2 63.0 56.0 3772 6.12 6.16 3.87
diamonds >> sample(n=3, replace=True)
carat cut color clarity depth table price x y z
52892 0.73 Very Good G SI1 60.6 59.0 2585 5.83 5.85 3.54
39454 0.57 Ideal H SI2 62.3 56.0 1077 5.31 5.28 3.30
39751 0.43 Ideal H VVS1 62.3 54.0 1094 4.84 4.85 3.02
distinct()
选择唯一行是使用distinct()完成的。
diamonds >> distinct(X.color)
carat cut color clarity depth table price x y z
0 0.23 Ideal E SI2 61.5 55.0 326 3.95 3.98 2.43
3 0.29 Premium I VS2 62.4 58.0 334 4.20 4.23 2.63
4 0.31 Good J SI2 63.3 58.0 335 4.34 4.35 2.75
7 0.26 Very Good H SI1 61.9 55.0 337 4.07 4.11 2.53
12 0.22 Premium F SI1 60.4 61.0 342 3.88 3.84 2.33
25 0.23 Very Good G VVS2 60.4 58.0 354 3.97 4.01 2.41
28 0.23 Very Good D VS2 60.5 61.0 357 3.96 3.97 2.40
python从2 1 2 2 2 63_Python从零开始第三章数据处理与分析python中的dplyr(2)相关推荐
- python中显示第三行数据_Python从零开始第三章数据处理与分析①python中的dplyr(1)...
前言 我经常使用R的dplyr软件包进行探索性数据分析和数据处理. dplyr除了提供一组可用于解决最常见数据操作问题的一致函数外,dplyr还允许用户使用管道函数编写优雅的可链接的数据操作代码. 现 ...
- python每隔半个小时执行一次_一篇文章教你用Python抓取微博评论
[Part1--理论篇] 试想一个问题,如果我们要抓取某个微博大V微博的评论数据,应该怎么实现呢?最简单的做法就是找到微博评论数据接口,然后通过改变参数来获取最新数据并保存.首先从微博api寻找抓取评 ...
- 《Python语言程序设计》王恺 机械工业出版社 第三章课后习题答案
第三章 函数 3.7 课后习题 (1)在Python语言中,使用函数分为两个步骤:定义函数和调用函数 (2)在Python语言中,函数定义需要使用def关键字 (3)形参是在定义函数时函数后面 ...
- 第三章 ArcGIS Pro创建 python 脚本工具(五)
其实整个第三章介绍的内容很少,真正的实验步骤,一节左右就可以概述处理,只是原书作者对于基础与一些信息都给了介绍,所以内容才会显得较多.关于新建自定义脚本工具,我觉得简单的来说,步骤就是创建脚本(如何写 ...
- python基础第三章选择结构答案-Python days03-选择结构【if】
编程基础:程序结构 通常情况下,代码为了模拟生活中的处理问题的方式/步骤,出现程序运行结构 1.顺序结构:按照从上到下的顺序,逐行解释执行代码! 2.选择结构:模拟生活中的选择条件,根据条件的结果来执 ...
- python3编写人工智能_人工智能学习第三章 编写第一个Python程序 及概念
接下来我们将看见如何在 Python 中运行一个传统的"Hello World"程序. 本章将会教你如何编写.保存与运行 Python 程序. 通过 Python 来运行的你的程序 ...
- python目标跟踪精度曲线图_目标跟踪配置(三)-评价指标-benchmark(更新中,关注请收藏。。。)...
目标跟踪基础与智能前沿 关注上方公众号,回复下方安装过程中对应关键字,获得对应安装包. 本文持续更新中- 连载可关注知乎专栏"目标跟踪基础与前沿" 文章目录 [ 目标跟踪基础与智能 ...
- 【深度学习入门:基于Python的理论与实现】书本学习笔记 第三章 神经网络
文章目录 1. 阶跃函数的实现 2. 函数图形 2.1 阶跃函数 2.2 sigmoid 函数 2.3 ReLU 函数 3. 多维数组的运算 3.1 矩阵乘法 3.2 神经网络的内积 4. 三层神经网 ...
- 《python编程快速上手 让繁琐工作自动化》第三章习题+实践答案
习题 1.为什么在程序中加入函数会有好处? 答:函数减少了重复的代码.这让程序更短,更容易阅读,更容易修改 2.函数中的代码何时执行:在函数被定义时,还是在函数被调用时? 答:函数中的代码在函数被调用 ...
最新文章
- MOOON-scheduler核心设计图(初稿)
- (译)如何用命令行在windows Azure上安装负载平衡的web Farm虚拟机(linux或其他)...
- webuploader结合php实现图片上传到本地和保存数据库
- 最邻近插值法(The nearest interpolation)实现图像缩放
- AtCoder AGC038D Unique Path (图论)
- Django系列目录
- windows to go 命令行模式建立
- js 控制超出字数显示省略号
- Zabbix的简单使用
- 官方正式预热小米10S:哈曼卡顿加持小米有史以来音质最好的手机
- 里的type_拥有Type-C接口等于拥有PD快充?当然不是!
- 疯狂挂载:Linux连接常用外部设备的方法
- vue2.0实现银行卡类型种类的选择
- 8.4文件系统的管理与挂载2
- mysql数据类型及占用字节数
- 上海电力大学计算机科学与技术学院,栗风永 - 上海电力大学 - 计算机科学与技术学院...
- 通过TCP网络协议实现控制台多人聊天功能,另附私聊@功能。(java)
- dataframe.append()合并多个列名相同的文件
- 应用程序无法运行,不是有效的Win32位程序解决(新手向)
- React Native version mismatch