在上一篇文章中,我们总结了分列的一种方式:当所有行在需要的分列的地方都是相同的字母、符号、空格等等的时候,我们可以使用str.split()直接将所有行分成两列。

然而在实际工作中,有可能有并不是所有的行都有用于分列的键。今天再总结两种:

数据源

上面这组数据中的Latitude是我们需要分列的列。每个数据中都有前缀ab,这是我们不需要的。我们要做的是从第三位开始将订单号切下来,就像对字符串进行的切片操作一样。

用str函数进行切片

很简单吧,先使用.str将‘Latitude‘这一列转换为类似字符串数据类型,然后再用[ ]切片器就行了。跟字符串一样,切片器可以切前面、后面、中间任一位置。

切片1

切片2

切好的数据可以通过简单赋值放到原数据里面:

切片后的数据加入源数据里

这样的方法只能对整齐的数值进行切片,图中的Latitude里的数字与字母的数量不一样,这样进行切片的话就会出错。

像这种数字和字母混合的字符串在处理的时候会比较麻烦,加入我们只需要数字或者字母要怎么处理呢?

这时候就要用到str.extract()函数和正则表达式了。

提取数据:

只匹配数字

提取字母:

只匹配字母

由于提取的字母占用了两行,因此要进行拼接:

只提取字母并进行拼接

注意书写格式:要提取的部分正则表达式要用引号引起来。抽取多个数字或者字母的话要在后面加上‘+‘。

将提取的数据加入到数据源

加入之后的数据并不是数值格式的(属于字符串格式的),因此不能跟正常的数值一样进行运算,需要计算的时候要进行格式的转换。

提取的数据不是数值类型

转换为浮点型

使用map和lambda匿名函数转换格式

pandas 字符串切片后保存_pandas的分列之不规则字符串及str.extract()相关推荐

  1. pandas 字符串切片后保存_pandas:快速处理字符串方法

    前言 当我们遇到一个超级大的DataFrame,里面有一列类型为字符串,要将每一行的字符串都用同一方式进行处理,一般会想到遍历整合DataFrame,但是如果直接这样做的话将会耗费很长时间,有时几个小 ...

  2. pandas 字符串切片后保存_我擦~字符串转字节切片后,切片的容量竟然千奇百怪...

    以下文章来源于新世界杂货铺 ,作者许文 新世界杂货铺 作为一名Gopher, 我愿称之为Go的干(杂)货铺子! 神奇的现象 切片, 切片, 又是切片! 今天遇到的神奇问题和切片有关, 具体怎么个神奇法 ...

  3. python pandas写入数据后保存_python读取MySQL数据使用pandas写入到csv,并保存列名

    实现的功能:通过pymysql连接MySQL数据库,查询所需数据,然后使用pandas写入到csv文件,并且写入包含数据列名. import sys import pandas as pd impor ...

  4. Photoshop之图片切片,切片后保存为前端可用素材

    1.首先拿一个图片示例 2.使用PS打开,左侧导航找到切片工具(不同版本PS位置可能会不一样) 3.将你所需要的图片/素材一块一块勾选出来 4.保存 5.结果

  5. pandas 分列(二)之不规则字符串及str.extract()

    pandas 分列(二)之不规则字符串及str.extract() 转载地址:https://www.jianshu.com/p/2e9b0a56405a 分列的一种方式:当所有行在需要的分列的地方都 ...

  6. linuxsed替换字符串后保存_Numpy运用-文件读写、存储及字符串处理

    问题列举: Numpy文件读取 Numpy文件存储 Numpy字符串操作 1.文件读取 可以使用genfromtxt读取txt或者csv文件 可以使用loadtxt读取txt或者csv文件 两个函数功 ...

  7. pandas使用pad函数向dataframe特定数据列的每个字符串添加后置(后缀)补齐字符或者字符串、向所有字符串的右侧填充、直到宽度达到指定要求(right padding)

    pandas使用pad函数向dataframe特定数据列的每个字符串添加后置(后缀)补齐字符或者字符串.向所有字符串的右侧填充.直到宽度达到指定要求(right padding) 目录

  8. pandas 替换 某列大于_Pandas使用总结

    前言 Pandas是机器学习三剑客之一,我们知道Numpy能够对数据进行很好的分析.操作.矩阵计算等,Pandas更侧重于数据的处理和分析,它的底层是使用Numpy实现的,在数据处理和分析方面提供了强 ...

  9. 【字符串的定义】【判断类型】【查找和替换】【大小写转换】【文本对齐】【去除空白字符】【拆分和连接】【字符串切片重点】【倒序切片】【内置函数】【for 循环语法 break】

    文章目录 字符串的定义 字符串的常用操作 判断类型 - 9 查找和替换 - 7 大小写转换 - 5 文本对齐 - 3 去除空白字符 - 3 拆分和连接 - 5 字符串的切片 重点 索引的顺序和倒序 * ...

最新文章

  1. python亲和性分析法推荐电影论文_数据挖掘-MovieLens数据集_电影推荐_亲和性分析_Aprioro算法...
  2. 两数组的交集(无重复)Intersection of Two Arrays
  3. ubuntu14.04 LTS 源码编译安装postgreSQL
  4. 在SAP Cloud Platform上消费Business partner service遇到的错误
  5. 对二维数组进行Zig-Zag扫描(C++)
  6. 多媒体技术基础及应用
  7. 堆栈在DNA计算机中的应用,堆栈和二叉树数据结构在DNA计算机中的设计与实现
  8. Bootstrap 带下拉的导航
  9. 【clickhouse】Application: DB::Exception: Duplicate interserver IO endpoint: DataPartsExchange
  10. 零基础带你学习MySQL—创建表(四)
  11. nginx负载php导致时间不一致,nginx – 为什么php-fpm会产生并在没有服务器负载的情况下每秒摧毁数百个孩子?...
  12. IP地址库ipip.net
  13. 数据结构与算法概念与理解
  14. 2009年度优科豪马轮胎全国经销商会议在三亚召开
  15. rtl驱动 ubuntu 禁用_Ubuntu如何安装rtl8822be驱动
  16. 以太网 STP临时环路的产生、STP BPDU的转发过程、根桥故障案例分析。
  17. 程序员编程技术迅速提高终极攻略
  18. 如何给笔记本安装固态硬盘
  19. 新考纲 PMP 备考精讲
  20. stm32f103系列开发板控制对数码管来显示自定义时间(自主学习)

热门文章

  1. 湾区求职分享:三个月刷题拿到 Google offer,欢迎踊跃提问
  2. 创建业务员销售分析图:
  3. HTML连载69-透视属性以及其他属性练习
  4. 吴恩达deeplearning.ai系列课程笔记+编程作业(13)序列模型(Sequence Models)-第一周 循环序列模型(Recurrent Neural Networks)
  5. 电子科技大学计算机科学与技术学硕,2021年电子科技大学计算机科学与技术(081200)考研专业目录_硕士研究生考试范围 - 学途吧...
  6. python编程锦囊_跟着Python编程锦囊,一起探索精彩的Python编程世界
  7. 如何快速给图片加框?
  8. 根据汉字首字母排序并进行分组
  9. virtualbox安装详解
  10. 多因子模型构建方法分类:回归法、打分法