Pandas系列(八)字符串处理
文章目录
- Pandas的字符串处理:
- 获取数据
- 获取Series的str属性
- 使用str的startswith、contains等得到bool的Series可以做条件查询
- 需要多次str处理的链式操作
- 使用正则表达式的处理
前面我们已经使用了字符串的处理函数:df["bWendu"].str.replace("℃", "").astype('int32')
Pandas的字符串处理:
- 使用方法:先获取
Series
的str
属性,然后在属性上调用函数; - 只能在字符串列上使用,不能数字列上使用;
Dataframe
上没有str
属性和处理方法Series.str
并不是Python
原生字符串,而是自己的一套方法,不过大部分和原生str
很相似;
- Series.str字符串方法列表参考文档
获取数据
df.dtypes
查看各列的数据类型:
获取Series的str属性
获取Series
的str
属性,然后使用各种字符串处理函数:
它是不能用于非string
类型的数据的。否者会报错:AttributeError: Can only use .str accessor with string values!
使用str的startswith、contains等得到bool的Series可以做条件查询
使用str
的startswith
、contains
等判断字符串中是否包含某些特定字符串,bool
类Series
可以做条件查询:
需要多次str处理的链式操作
比如怎样提取201803这样的数字月份?可以分为两步:1、先将日期2018-03-31替换成20180331的形式;2、提取月份字符串201803。
这里要注意str.method
返回的是一个Series
,在这个Series
上再进行.method
是会报错的:
这里要注意slice
就是切片语法,可以直接用。
使用正则表达式的处理
将中文的年月日添加为新列:
Series.str
默认就开启了正则表达式模式:
Pandas系列(八)字符串处理相关推荐
- python-将DataFrame中的 pandas 系列从字符串(财务缩写)转换为数字
我正在尝试从NOAA解析风暴数据.经过一些清理和解析后,我剩下一个DataFrame,就像这样: import pandas as pddata = { 'ID' : [1, 2, 3, 4, 5, ...
- Python 数据分析三剑客之 Pandas(八):数据重塑、重复数据处理与数据替换
CSDN 课程推荐:<迈向数据科学家:带你玩转Python数据分析>,讲师齐伟,苏州研途教育科技有限公司CTO,苏州大学应用统计专业硕士生指导委员会委员:已出版<跟老齐学Python ...
- Python数据分析学习系列 八 数据规整:聚合、合并和重塑
Python数据分析学习系列 八 数据规整:聚合.合并和重塑 资料转自(GitHub地址):https://github.com/wesm/pydata-book 有需要的朋友可以自行去github下 ...
- JAVA面试常考系列八
转载自 JAVA面试常考系列八 题目一 JDBC是什么? JDBC(Java DataBase Connectivity,java数据库连接)是一种用于执行SQL语句的Java API,可以为多种关系 ...
- 5Python全栈之路系列之字符串格式化
Python全栈之路系列之字符串格式化 This PEP proposes a new system for built-in string formatting operations, intend ...
- Pandas系列(三):数据清洗
Pandas系列目录 文章目录 一. 简介 二. 思维导图 三. Pandas数据清洗 1. 空值.缺失值处理 1.1 空值.缺失值判断 1.2 空值处理 2. 异常数据替换 2.1 条件替换 2.2 ...
- pandas中的字符串处理函数
欢迎关注"生信修炼手册"! 在pandas中,通过DataFrame来存储文件中的内容,其中最常见的数据类型就是字符串了.针对字符串,pandas提供了一系列的函数,来提高操作效率 ...
- Pandas系列(一):数据结构(Series、DataFrame、时间序列)
Pandas系列目录 文章目录 一. 简介 二. 思维导图 三. Pandas数据结构 1. Series 1.1 简介 1.2 创建Series 1.3 Series属性 1.4 索引切片 1.4. ...
- 【×××系列八】Dynamic Multipoint *** for IPv6 详解
[×××系列八]Dynamic Multipoint *** for IPv6 详解 一.前言 由于涉及IPV6加密,所以根据思科标准此次配置使用思科7200系列高级企业版IOS (详情参考我的上一篇 ...
- 【深入浅出MyBatis系列八】SQL自动生成插件
为什么80%的码农都做不了架构师?>>> #0 系列目录# 深入浅出MyBatis系列 [深入浅出MyBatis系列一]MyBatis入门 [深入浅出MyBatis系列二]配置 ...
最新文章
- 英语是缺乏AOP的语言,汉语是具备AOP的语言。
- Java之Java程序与虚拟机
- python 字典、列表、字符串 之间的相互转换
- 浓浓的亲情 2008-10-6 8:53:00 (21ic)
- 流媒体服务器主板型号怎么看,关于服务器的详解
- android 客户端bks,Keytools Https双向认证(Android通用)
- 苹果笔记本调整 pycharm 字体大小的地方
- Struts1.2+Spring2.5+Hibernate3.2框架搭建(十三)
- 10 款最新的 jQuery 内容滑块插件
- Tarjan边的双联通
- Windows XP注册表修改精粹
- CSDN极客头条使用指南
- 《神经网络与深度学习》读书笔记(不完全)
- Kernel那些事儿之内存管理(6) --- 衣带渐宽终不悔(下)
- Visual Studio Code 配置C/C++编译环境流程及问题解决(Win10环境)
- 纳斯达克对经济泡沫的定义是:当交易价格远大于内在价值的时候,就称为泡沫(转)...
- Veritas NetBackup 7.7.3 + Vistor 虚拟带库
- Python实现给一个不多于5位的正整数,求它是几位数,逆序打印这个数字
- 开源的Android视频播放器
- linux脚本编程教程