Pandas(八)--字符串函数
Pandas(版本号1.3.4) 提供了一系列的字符串函数,因此能够很方便地对字符串进行处理。
常用的字符串处理函数如下表所示:
函数名称 | 函数功能和描述 |
---|---|
lower() | 将的字符串转换为小写。 |
upper() | 将的字符串转换为大写。 |
len() | 得出字符串的长度。 |
strip() | 去除字符串两边的空格(包含换行符)。 |
split() | 用指定的分割符分割字符串。 |
cat(sep="") | 用给定的分隔符连接字符串元素。 |
get_dummies() | 返回一个带有独热编码值的 DataFrame 结构。 |
contains(pattern) | 如果子字符串包含在元素中,则为每个元素返回一个布尔值 True,否则为 False。 |
replace(a,b) | 将值 a 替换为值 b。 |
count(pattern) | 返回每个字符串元素出现的次数。 |
startswith(pattern) | 如果 Series 中的元素以指定的字符串开头,则返回 True。 |
endswith(pattern) | 如果 Series 中的元素以指定的字符串结尾,则返回 True。 |
findall(pattern) | 以列表的形式返出现的字符串。 |
swapcase() | 交换大小写。 |
islower() | 返回布尔值,检查 Series 中组成每个字符串的所有字符是否都为小写。 |
issupper() | 返回布尔值,检查 Series 中组成每个字符串的所有字符是否都为大写。 |
isnumeric() | 返回布尔值,检查 Series 中组成每个字符串的所有字符是否都为数字。 |
repeat(value) | 以指定的次数重复每个元素。 |
find(pattern) | 返回字符串第一次出现的索引位置。 |
注意:上述所有字符串函数全部适用于 Series/DataFrame 对象,也可以与 Python 内置的字符串函数一起使用,这些函数在处理 Series/DataFrame 对象的时候会自动忽略缺失值数据(NaN)。
- import pandas as pd
- import numpy as np
- s = pd.Series(['C', 'Python', 'java', np.nan, '1125'])
lower()
print(s.str.lower())输出结果:
0 c
1 python
2 java
3 NaN
4 1125
dtype: object
len()
print(s.str.len())输出结果:
0 1.0
1 6.0
2 4.0
3 NaN
4 4.0
dtype: float64
strip()
print(s.str.strip())输出结果:
0 C
1 Python
2 java
3 NaN
4 1125
dtype: object
split(pattern)
print(s.str.split(" "))输出结果:
0 [C]
1 [Python]
2 [java]
3 NaN
4 [1125]
dtype: object
cat(sep="")
#会自动忽略NaN
print(s.str.cat(sep="_"))输出结果:
C_Python_java_1125
get_dummies()
print(s.str.get_dummies())输出结果:1125 C Python java
0 0 1 0 0
1 0 0 1 0
2 0 0 0 1
3 0 0 0 0
4 1 0 0 0
contains()
检查 Series 中的每个字符,如果字符中包含空格,则返回 True,否则返回 False。示例如下:
print(s.str.contains(" "))0 False
1 False
2 False
3 NaN
4 False
dtype: object
repeat()
print(s.str.repeat(3))输出结果:
0 CCC
1 PythonPythonPython
2 javajavajava
3 NaN
4 112511251125
startswith()
#若以指定的"j"开头则返回True
print(s.str.startswith("j"))输出结果:
0 False
1 False
2 True
3 NaN
4 False
dtype: object
find()
print(s.str.find("j"))输出结果:
0 -1.0
1 -1.0
2 0.0
3 NaN
4 -1.0
dtype: float64
如果返回 -1 表示该字符串中没有出现指定的字符。
findall()
print(s.str.findall("j"))输出结果:
0 []
1 []
2 [j]
3 NaN
4 []
dtype: object
swapcase()
print(s.str.swapcase())输出结果:
0 c
1 pYTHON
2 JAVA
3 NaN
4 1125
dtype: object
isnumeric()
返回一个布尔值,用来判断是否存在数字型字符串。示例如下:
print(s.str.isnumeric())输出结果:
0 False
1 False
2 False
3 NaN
4 True
dtype: object
Pandas(八)--字符串函数相关推荐
- pandas使用extract函数根据正则表达式从dataframe指定数据列的字符串中抽取出数字并生成新的数据列(extract numbers from column)
pandas使用extract函数根据正则表达式从dataframe指定数据列的字符串中抽取出数字并生成新的数据列(extract numbers from column and generate n ...
- pandas使用str函数和contains函数查看dataframe特定数据列中是否匹配或包含特定模式的字符串(match or contain a pattern in column value)
pandas使用str函数和contains函数查看dataframe特定数据列中是否匹配或包含特定模式的字符串(match or contain a pattern in column value) ...
- pandas使用replace函数将dataframe指定数据列中的特定字符串进行自定义替换(replace substring in dataframe column values)
pandas使用replace函数将dataframe指定数据列中的特定字符串进行自定义替换(replace substring in dataframe column values) 目录
- pandas使用read_csv函数读取文件并解析日期数据列(parse dates)、pandas使用read_csv函数读取文件并将缺失值转化为空字符串
pandas使用read_csv函数读取文件并解析日期数据列(parse dates).pandas使用read_csv函数读取文件并将缺失值转化为空字符串 目录
- pandas使用replace函数和正则表达式移除dataframe字符串数据列中头部指定模式字符串(Removing leading substring in dataframe)
pandas使用replace函数和正则表达式移除dataframe字符串数据列中头部指定模式字符串(Removing leading substring in dataframe) 目录
- pandas使用fillna函数将dataframe中缺失值替换为空字符串(replace missing value with blank string in dataframe)
pandas使用fillna函数将dataframe中缺失值替换为空字符串(replace missing value with blank string in dataframe) 目录 panda ...
- pandas使用query函数基于dataframe字符串数据列中字符串的长度筛选dataframe的数据行(specific column string length)
pandas使用query函数基于dataframe字符串数据列中字符串的长度筛选dataframe的数据行(select dataframe rows based on specific colum ...
- pandas使用to_datetime函数把dataframe的字符串日期数据列转化为日期格式日期数据列( strings to datetime in dataframe column)
pandas使用to_datetime函数把dataframe的字符串日期数据列转化为日期格式日期数据列( strings to datetime in dataframe column) 目录
- pandas使用read_csv函数读取文件时指定数据列的数据类型、pandas使用read_csv函数读取文件时通过keep_default_na参数设置缺失值替换为空字符串
pandas使用read_csv函数读取文件时指定数据列的数据类型.pandas使用read_csv函数读取文件时通过keep_default_na参数设置缺失值替换为空字符串 目录
最新文章
- go语言学习--内核态和用户态(协程)
- 游戏开发之拷贝构造函数,即复制构造函数(explicit关键字及拷贝构造函数的调用时机)(C++基础)
- 天津成人高考计算机基础知识题库,天津市成考《计算机基础考试大纲》(高中起点)...
- 20个免费网站测试工具
- 《考研公共课复习指导》数学篇1:考研数学策略
- 云服务器查看物理MAC地址的方法
- B-Tree和B+Tree学习笔记
- 电机控制系统php,基于FPGA的直流电机PWM控制系统(附带源码下载)
- 东北大学计算机学院杨金柱院长,电子信息学院赴东北大学走访、调研
- pd.read_csv报错:UnicodeDecodeError: ‘utf-8‘ codec can‘t decode byte 0xc8 in position 0: invalid contin
- 【重磅】61篇NIPS2019深度强化学习论文及部分解读
- CharacterUtils 判断中英文,英文大小写
- Golang将密码盐加密
- 费马小定理证明及应用
- PHP 门面设计模式
- r语言 siar 代码_sair方法及R操作入门——稳定同位素之食物来源比例分析
- 手机回收价格—换换回收让用户低成本换机
- Spring和SpringBoot中针对单一接口多种实现的支持
- 利用Java Calendar类打印日历
- 内存(Memory)
热门文章
- linux ip转发如何设置,如何在Linux上启用IP转发
- Python中正则表达式findall用法
- 如何使用蓝牙Nintendo Switch JoyCon控制器在Windows上控制PowerPoint! (或Surface Pen)
- VMware虚拟机网速慢的解决办法
- 抓包神器TCPDUMP的分析总结-涵盖各大使用场景、高级用法
- Android模拟器学framework和driver之传感器篇3(Android HAL)
- 读《抓信每分钱 洛克菲勒自传》
- 3.4 mov、add、sub指令
- 我一天的工作,同事一个小时就做完了?python的应用
- 简单强大的Python库:Schedule—实用的周期任务调度工具