Python——提取符号、表格拆分数据(指定分隔符、分列)
目录
1 指定多个分隔符——re.split()
2 表格分列——str.split()
3 提取前几个字符
4 指定分隔符分列
1 指定多个分隔符——re.split()
import re
text='3,5.6:6'
print(re.split('[.,:]',text))
输出
['3', '5', '6', '6']
2 表格分列——str.split()
pandas.Series.str.split(pat=None, n=-1, expand=False)
pat表示分隔符,默认以空格分隔;n表示分割次数,默认为 -1,即分隔所有;expand为true,表示会把切割出来的内容当做一列,产生多列,若为False,则把切割后的内容当作一个列表。
3 提取前几个字符
#x[0:2]前二位
df['列名']=df['列名'].apply(lambda x:x[0:2]).tolist()
实例
Login_nei['shengfen'] = Login_nei['login_place'].apply(lambda x:x[2:5]).tolist()
Login_nei['chengshi'] = Login_nei['login_place'].apply(lambda x:x[5:]).tolist()
Login_nei.head()
4 指定分隔符分列
#将日期与时间分割
Login1 = Login["login_time"].str.split(" ",expand=True).fillna("")
Login1['login_data'] = Login1[0]
Login1['login_hour'] = Login1[1]
Login1['user_id'] = Login['user_id']
Login2 = Login1[['user_id','login_data','login_hour']]
Login2.head()
Python——提取符号、表格拆分数据(指定分隔符、分列)相关推荐
- EXCEL数据指定分隔符分列
EXCEL数据指定分隔符分列 -这么好用的按钮我居然以前都没看到 呜呜呜~ -选中要分列的数据,然后点 数据–>分列–>分隔符号–>下一步: –>在其他后面输入框中输入你要指定 ...
- python提取word表格中数据
程序分析 今天文章介绍一个实战案例,与自动化办公相关:案例思想是源于前两天帮读者做了一个 demo ,需求大致将一上百个 word 中表格内容提取出来(所有word 中表格样式一样),把提取到的内容自 ...
- python读取csv表格的数据并用matplotlib画曲线图
前言 python读取csv表格的数据并用matplotlib回曲线图 1.导入相关库 import matplotlib.pyplot as plt import pandas as pd impo ...
- python 显示表格数据_python显示excel表格数据-怎么用python读取excel表格的数据
怎么用python读取excel表格的数据 #导入包 import xlrd #设置路径 path='C:\\Users\\jyjh\\Desktop\\datap.xlsx' #打开 data=xl ...
- python提取excel表格数据
文章目录 一.说明: 二.带着我发现的来个问题,寻找解决方法: 0.安装模块`xlrd` 1.解决哪一行是开始的行的问题: 2.解决,表格中有合并单元格的问题: 3.结合1和2的问题解决,弄个自动化识 ...
- python提取pdf表格数据并保存到excel中
pdfplumber操作pdf文件 python开源库pdfplumber,可以较为方便地获取pdf的各种信息,包含pdf的基本信息(作者.创建时间.修改时间-)及表格.文本.图片等信息,基本可以满足 ...
- Python提取PDF表格及文本!(附源码)
前言 本文的文字及图片来源于网络,仅供学习.交流使用,不具有任何商业用途,如有问题请及时联系我们以作处理. PS:如有需要Python学习资料的小伙伴可以点击下方链接自行获取 Python免费学习资料 ...
- 用python提取PDF表格内容保存到excel
一 提取pdf方法介绍 任务是用python提取PDF里的表格文件到excel里面去.做为一个 学了一个周python的人来说当然像尝试一下看能不能做到,事实证明是可以的只是可能代码有点烂...... ...
- python 提取复杂 json 的数据
前言 在越来越多的项目中,基本都用了 json 作为接口数据返回的格式.json 给我们的感觉就是通俗易懂,只是即使再复杂的结构也会比其他格式容易看.然而一旦在调试或者测试中需要用到提取某一部分字 ...
最新文章
- 小程序音频播放报10001 解决方案 errCode:10001, errMsg:errCode:602,err:error,not found param
- 怎么用python运行代码_python怎么运行代码程序
- Android属性之build.prop生成过程分析
- SAP ABAP技能树
- xen虚拟化实战系列(一)之xen虚拟化环境安装
- IIS6.0支持PHP设置
- LeetCode —— 257. 二叉树的所有路径(Python)
- 7-81 单词长度 (15 分)
- python+selenium+chrome driver 64位环境配置
- 计算机图表公式,通达信的DRAWICON49个图标公式
- 【GDOI模拟】屏保
- 如何做 ASO 优化?
- html canvas 绘制转盘,Canvas绘制转盘
- 《再贵也能卖到翻》 博客思听 2009年3月
- WIN10系统安装虚拟机以及CentOS7
- 日常修行中离不开观想
- 常用的网络营销推广渠道方式
- java输出GPA_请完成下列Java程序:实现换算GPA,对于学生学习的每一门课程,都输入两个..._考试资料网...
- 8款最好用的固定资产管理软件
- 集合竞价如何买入_老股民教你如何用集合竞价买入涨停板,散户看到就是赚到!...
热门文章
- java response header_java中response.setHeader()
- 《可穿戴环形生物阻抗装置连续无袖血压监测》阅读笔记
- php 仿美团切换城市,微信小程序仿美团城市选择的实现
- rx2700_AMD二代锐龙Ryzen7 2700X内置核显吗 R7-2700/2700X要搭配显卡吗?
- 关于37%法则的探究
- 3DMAX2018如何制作旗杆
- 【论文笔记之 Speech Separation Overview】Supervised Speech Separation Based on Deep Learning-An Overview
- 花呗最高额度只有5万,为何有人花呗额度可以达到1000万?
- ubuntu 16.04彻底卸载nginx
- 口碑最好的国产蓝牙耳机有哪些?国产蓝牙耳机品牌排行榜前十名