Pandas(版本号1.3.4) 提供了一系列的字符串函数,因此能够很方便地对字符串进行处理。
常用的字符串处理函数如下表所示:

函数名称 函数功能和描述
lower() 将的字符串转换为小写。
upper() 将的字符串转换为大写。
len() 得出字符串的长度。
strip() 去除字符串两边的空格(包含换行符)。
split() 用指定的分割符分割字符串。
cat(sep="") 用给定的分隔符连接字符串元素。
get_dummies() 返回一个带有独热编码值的 DataFrame 结构。
contains(pattern) 如果子字符串包含在元素中,则为每个元素返回一个布尔值 True,否则为 False。
replace(a,b) 将值 a 替换为值 b。
count(pattern) 返回每个字符串元素出现的次数。
startswith(pattern) 如果 Series 中的元素以指定的字符串开头,则返回 True。
endswith(pattern) 如果 Series 中的元素以指定的字符串结尾,则返回 True。
findall(pattern) 以列表的形式返出现的字符串。
swapcase() 交换大小写。
islower() 返回布尔值,检查 Series 中组成每个字符串的所有字符是否都为小写。
issupper() 返回布尔值,检查 Series 中组成每个字符串的所有字符是否都为大写。
isnumeric() 返回布尔值,检查 Series 中组成每个字符串的所有字符是否都为数字。
repeat(value) 以指定的次数重复每个元素。
find(pattern) 返回字符串第一次出现的索引位置。

注意:上述所有字符串函数全部适用于 Series/DataFrame 对象,也可以与 Python 内置的字符串函数一起使用,这些函数在处理 Series/DataFrame 对象的时候会自动忽略缺失值数据(NaN)

  1. import pandas as pd
  2. import numpy as np
  3. s = pd.Series(['C', 'Python', 'java', np.nan, '1125'])

lower()

print(s.str.lower())输出结果:
0             c
1        python
2          java
3           NaN
4          1125
dtype: object

len()

print(s.str.len())输出结果:
0     1.0
1     6.0
2     4.0
3     NaN
4     4.0
dtype: float64

strip()

print(s.str.strip())输出结果:
0             C
1        Python
2          java
3           NaN
4          1125
dtype: object

split(pattern)

print(s.str.split(" "))输出结果:
0         [C]
1    [Python]
2      [java]
3         NaN
4      [1125]
dtype: object

cat(sep="")

#会自动忽略NaN
print(s.str.cat(sep="_"))输出结果:
C_Python_java_1125

get_dummies()

print(s.str.get_dummies())输出结果:1125  C  Python  java
0     0  1       0     0
1     0  0       1     0
2     0  0       0     1
3     0  0       0     0
4     1  0       0     0

contains()

检查 Series 中的每个字符,如果字符中包含空格,则返回 True,否则返回 False。示例如下:

print(s.str.contains(" "))0    False
1    False
2    False
3      NaN
4    False
dtype: object

repeat()

print(s.str.repeat(3))输出结果:
0                   CCC
1    PythonPythonPython
2          javajavajava
3                   NaN
4          112511251125

startswith()

#若以指定的"j"开头则返回True
print(s.str.startswith("j"))输出结果:
0    False
1    False
2     True
3      NaN
4    False
dtype: object

find()

print(s.str.find("j"))输出结果:
0   -1.0
1   -1.0
2    0.0
3    NaN
4   -1.0
dtype: float64

如果返回 -1 表示该字符串中没有出现指定的字符。

findall()

print(s.str.findall("j"))输出结果:
0     []
1     []
2    [j]
3    NaN
4     []
dtype: object

swapcase()

print(s.str.swapcase())输出结果:
0         c
1    pYTHON
2      JAVA
3       NaN
4      1125
dtype: object

isnumeric()

返回一个布尔值,用来判断是否存在数字型字符串。示例如下:

print(s.str.isnumeric())输出结果:
0    False
1    False
2    False
3      NaN
4     True
dtype: object

Pandas(八)--字符串函数相关推荐

  1. pandas使用extract函数根据正则表达式从dataframe指定数据列的字符串中抽取出数字并生成新的数据列(extract numbers from column)

    pandas使用extract函数根据正则表达式从dataframe指定数据列的字符串中抽取出数字并生成新的数据列(extract numbers from column and generate n ...

  2. pandas使用str函数和contains函数查看dataframe特定数据列中是否匹配或包含特定模式的字符串(match or contain a pattern in column value)

    pandas使用str函数和contains函数查看dataframe特定数据列中是否匹配或包含特定模式的字符串(match or contain a pattern in column value) ...

  3. pandas使用replace函数将dataframe指定数据列中的特定字符串进行自定义替换(replace substring in dataframe column values)

    pandas使用replace函数将dataframe指定数据列中的特定字符串进行自定义替换(replace substring in dataframe column values) 目录

  4. pandas使用read_csv函数读取文件并解析日期数据列(parse dates)、pandas使用read_csv函数读取文件并将缺失值转化为空字符串

    pandas使用read_csv函数读取文件并解析日期数据列(parse dates).pandas使用read_csv函数读取文件并将缺失值转化为空字符串 目录

  5. pandas使用replace函数和正则表达式移除dataframe字符串数据列中头部指定模式字符串(Removing leading substring in dataframe)

    pandas使用replace函数和正则表达式移除dataframe字符串数据列中头部指定模式字符串(Removing leading substring in dataframe) 目录

  6. pandas使用fillna函数将dataframe中缺失值替换为空字符串(replace missing value with blank string in dataframe)

    pandas使用fillna函数将dataframe中缺失值替换为空字符串(replace missing value with blank string in dataframe) 目录 panda ...

  7. pandas使用query函数基于dataframe字符串数据列中字符串的长度筛选dataframe的数据行(specific column string length)

    pandas使用query函数基于dataframe字符串数据列中字符串的长度筛选dataframe的数据行(select dataframe rows based on specific colum ...

  8. pandas使用to_datetime函数把dataframe的字符串日期数据列转化为日期格式日期数据列( strings to datetime in dataframe column)

    pandas使用to_datetime函数把dataframe的字符串日期数据列转化为日期格式日期数据列( strings to datetime in dataframe column) 目录

  9. pandas使用read_csv函数读取文件时指定数据列的数据类型、pandas使用read_csv函数读取文件时通过keep_default_na参数设置缺失值替换为空字符串

    pandas使用read_csv函数读取文件时指定数据列的数据类型.pandas使用read_csv函数读取文件时通过keep_default_na参数设置缺失值替换为空字符串 目录

最新文章

  1. go语言学习--内核态和用户态(协程)
  2. 游戏开发之拷贝构造函数,即复制构造函数(explicit关键字及拷贝构造函数的调用时机)(C++基础)
  3. 天津成人高考计算机基础知识题库,天津市成考《计算机基础考试大纲》(高中起点)...
  4. 20个免费网站测试工具
  5. 《考研公共课复习指导》数学篇1:考研数学策略
  6. 云服务器查看物理MAC地址的方法
  7. B-Tree和B+Tree学习笔记
  8. 电机控制系统php,基于FPGA的直流电机PWM控制系统(附带源码下载)
  9. 东北大学计算机学院杨金柱院长,电子信息学院赴东北大学走访、调研
  10. pd.read_csv报错:UnicodeDecodeError: ‘utf-8‘ codec can‘t decode byte 0xc8 in position 0: invalid contin
  11. 【重磅】61篇NIPS2019深度强化学习论文及部分解读
  12. CharacterUtils 判断中英文,英文大小写
  13. Golang将密码盐加密
  14. 费马小定理证明及应用
  15. PHP 门面设计模式
  16. r语言 siar 代码_sair方法及R操作入门——稳定同位素之食物来源比例分析
  17. 手机回收价格—换换回收让用户低成本换机
  18. Spring和SpringBoot中针对单一接口多种实现的支持
  19. 利用Java Calendar类打印日历
  20. 内存(Memory)

热门文章

  1. linux ip转发如何设置,如何在Linux上启用IP转发
  2. Python中正则表达式findall用法
  3. 如何使用蓝牙Nintendo Switch JoyCon控制器在Windows上控制PowerPoint! (或Surface Pen)
  4. VMware虚拟机网速慢的解决办法
  5. 抓包神器TCPDUMP的分析总结-涵盖各大使用场景、高级用法
  6. Android模拟器学framework和driver之传感器篇3(Android HAL)
  7. 读《抓信每分钱 洛克菲勒自传》
  8. 3.4 mov、add、sub指令
  9. 我一天的工作,同事一个小时就做完了?python的应用
  10. 简单强大的Python库:Schedule—实用的周期任务调度工具