文章目录

  • Pandas的字符串处理:
  • 获取数据
  • 获取Series的str属性
  • 使用str的startswith、contains等得到bool的Series可以做条件查询
  • 需要多次str处理的链式操作
  • 使用正则表达式的处理

  前面我们已经使用了字符串的处理函数:df["bWendu"].str.replace("℃", "").astype('int32')

Pandas的字符串处理:

  1. 使用方法:先获取Seriesstr属性,然后在属性上调用函数;
  2. 只能在字符串列上使用,不能数字列上使用;
  3. Dataframe上没有str属性和处理方法
  4. Series.str并不是Python原生字符串,而是自己的一套方法,不过大部分和原生str很相似;
  • Series.str字符串方法列表参考文档

获取数据

  df.dtypes查看各列的数据类型:

获取Series的str属性

  获取Seriesstr属性,然后使用各种字符串处理函数:

  它是不能用于非string类型的数据的。否者会报错:AttributeError: Can only use .str accessor with string values!

使用str的startswith、contains等得到bool的Series可以做条件查询

  使用strstartswithcontains等判断字符串中是否包含某些特定字符串,boolSeries可以做条件查询:

需要多次str处理的链式操作

  比如怎样提取201803这样的数字月份?可以分为两步:1、先将日期2018-03-31替换成20180331的形式;2、提取月份字符串201803。

  这里要注意str.method返回的是一个Series,在这个Series上再进行.method是会报错的:

  这里要注意slice就是切片语法,可以直接用。

使用正则表达式的处理

  将中文的年月日添加为新列:

  Series.str默认就开启了正则表达式模式:

Pandas系列(八)字符串处理相关推荐

  1. python-将DataFrame中的 pandas 系列从字符串(财务缩写)转换为数字

    我正在尝试从NOAA解析风暴数据.经过一些清理和解析后,我剩下一个DataFrame,就像这样: import pandas as pddata = { 'ID' : [1, 2, 3, 4, 5, ...

  2. Python 数据分析三剑客之 Pandas(八):数据重塑、重复数据处理与数据替换

    CSDN 课程推荐:<迈向数据科学家:带你玩转Python数据分析>,讲师齐伟,苏州研途教育科技有限公司CTO,苏州大学应用统计专业硕士生指导委员会委员:已出版<跟老齐学Python ...

  3. Python数据分析学习系列 八 数据规整:聚合、合并和重塑

    Python数据分析学习系列 八 数据规整:聚合.合并和重塑 资料转自(GitHub地址):https://github.com/wesm/pydata-book 有需要的朋友可以自行去github下 ...

  4. JAVA面试常考系列八

    转载自 JAVA面试常考系列八 题目一 JDBC是什么? JDBC(Java DataBase Connectivity,java数据库连接)是一种用于执行SQL语句的Java API,可以为多种关系 ...

  5. 5Python全栈之路系列之字符串格式化

    Python全栈之路系列之字符串格式化 This PEP proposes a new system for built-in string formatting operations, intend ...

  6. Pandas系列(三):数据清洗

    Pandas系列目录 文章目录 一. 简介 二. 思维导图 三. Pandas数据清洗 1. 空值.缺失值处理 1.1 空值.缺失值判断 1.2 空值处理 2. 异常数据替换 2.1 条件替换 2.2 ...

  7. pandas中的字符串处理函数

    欢迎关注"生信修炼手册"! 在pandas中,通过DataFrame来存储文件中的内容,其中最常见的数据类型就是字符串了.针对字符串,pandas提供了一系列的函数,来提高操作效率 ...

  8. Pandas系列(一):数据结构(Series、DataFrame、时间序列)

    Pandas系列目录 文章目录 一. 简介 二. 思维导图 三. Pandas数据结构 1. Series 1.1 简介 1.2 创建Series 1.3 Series属性 1.4 索引切片 1.4. ...

  9. 【×××系列八】Dynamic Multipoint *** for IPv6 详解

    [×××系列八]Dynamic Multipoint *** for IPv6 详解 一.前言 由于涉及IPV6加密,所以根据思科标准此次配置使用思科7200系列高级企业版IOS (详情参考我的上一篇 ...

  10. 【深入浅出MyBatis系列八】SQL自动生成插件

    为什么80%的码农都做不了架构师?>>>    #0 系列目录# 深入浅出MyBatis系列 [深入浅出MyBatis系列一]MyBatis入门 [深入浅出MyBatis系列二]配置 ...

最新文章

  1. 英语是缺乏AOP的语言,汉语是具备AOP的语言。
  2. Java之Java程序与虚拟机
  3. python 字典、列表、字符串 之间的相互转换
  4. 浓浓的亲情 2008-10-6 8:53:00 (21ic)
  5. 流媒体服务器主板型号怎么看,关于服务器的详解
  6. android 客户端bks,Keytools Https双向认证(Android通用)
  7. 苹果笔记本调整 pycharm 字体大小的地方
  8. Struts1.2+Spring2.5+Hibernate3.2框架搭建(十三)
  9. 10 款最新的 jQuery 内容滑块插件
  10. Tarjan边的双联通
  11. Windows XP注册表修改精粹
  12. CSDN极客头条使用指南
  13. 《神经网络与深度学习》读书笔记(不完全)
  14. Kernel那些事儿之内存管理(6) --- 衣带渐宽终不悔(下)
  15. Visual Studio Code 配置C/C++编译环境流程及问题解决(Win10环境)
  16. 纳斯达克对经济泡沫的定义是:当交易价格远大于内在价值的时候,就称为泡沫(转)...
  17. Veritas NetBackup 7.7.3 + Vistor 虚拟带库
  18. Python实现给一个不多于5位的正整数,求它是几位数,逆序打印这个数字
  19. 开源的Android视频播放器
  20. linux脚本编程教程

热门文章

  1. 一张图搞懂VLAN中的标签
  2. web安全day5:DNS部署与安全
  3. web安全day4--DHCP部署与安全
  4. ELK详解(十)——Logstash收集Tomcat日志实战
  5. FastSocket学习笔记~再说客户端与服务端的组成
  6. Log42j 源代码分析:日志回滚
  7. js模块化开发——模块的写法
  8. PowerDesigner(四)-业务处理模型(转)
  9. 构造一个日期类java,java 日期类
  10. php获取远程文件夹下的文件是否存在,PHP判断远程文件是否存在函数