Python pandas数据分列,分割符号固定宽度
背景
数据分列在数据处理中很常见,数据分列一般指的都是字符串分割,这个功能在Excel里面很实用,处理数据非常方便,那么在pandas数据框中怎么使用呢,今天这篇文章就来详细介绍下
模拟数据
以下面这9行数据作为案例来进行处理
读取数据
#加载库
import pandas as pd#读取数据
data=pd.read_excel('data.xlsx')
分割符号分列
主要运用了pandas里面列的str
属性,str
有很多的方法,感性的同学可以自动查找,这里不做过多介绍。分割字符用到的就是split
方法重点:在分割前一定要把该列强制转换为字符型
#对指定列进行分割
split_data_1=data['分割字符'].astype('str').str.split('&',expand=True)#修改分割后的字段名称
split_data_1.columns=['D_'+str(i) for i in split_data_1.columns]#与原始数据进行合并
data_result=data.join(split_data_1)
固定宽度分列
pandas里面没有固定分割的相应函数,这里巧妙的运用了辅助函数来进行处理,这里的固定宽度为1
#定义个辅助函数
def concat_split(x,width=1):result=''start=0while True:s=str(x)[start:start+width]if s:result =result + s + '&'else:breakstart=start+widthreturn result[:-1]#先利用辅助函数,再进行分割
split_data_2=data['固定宽度'].map(concat_split).str.split('&',expand=True)#修改分割后的字段名称
split_data_2.columns=['W_'+str(i) for i in split_data_2.columns]#与原始数据进行合并
data_result=data.join(split_data_2)
历史相关文章
- Python pandas 里面的数据类型坑,astype要慎用
- Python pandas 数据无法正常分列
以上是自己实践中遇到的一些问题,分享出来供大家参考学习,欢迎关注微信公众号:DataShare ,不定期分享干货
http://www.taodudu.cc/news/show-4628986.html
相关文章:
- Hive 数据聚合成键值对时,根据值大小进行排序
- ABAP ALV中自定义搜索帮助
- HTML+CSS+JavaScript做一个简约的浏览器主页
- Pandas数据处理误区要知其然知其所以然
- Python 两个字典如何实现相加?(相同的键,值相加)
- Python pandas在读取csv文件时(linux与windows之间传输),数据行数不一致的问题
- Hive中各种日期格式转换方法总结
- 数据分析师常用的 Linux 命令总结
- Python 利用数据分布直方图来确定合适的阈值
- 利用Python计算两个地理位置之间的中点
- pandas 错误提醒:FutureWarning: elementwise comparison failed;
- Python 基于pyecharts自定义经纬度热力图可视化
- Python pandas 里面的数据类型坑,astype要慎用
- Python数据处理中 pd.concat 与 pd.merge 区别
- Python 利用聚类算法对图片进行颜色压缩
- Hive 中的各种常用set设置
- Python 利用4行代码实现图片灰度化
- Python 字符串格式化 f-string f“{}“ .format
- apollo服务器集成java_Apollo Server 集成性能监控
- SQL语句大全 作者:阿多
- MD5算法在PB中的实现(转载自 - 阿多米 - 博客园)
- E站账号cookie分享_不用输入密码无风险?扫描二维码登录QQ账号也不安全!
- E.164号码,E.214号码,E.212号码
- E码通电子凭证服务平台 通用接口接入规范
- 【论文笔记-NER综述】A Survey on Deep Learning for Named Entity Recognition
- MT-BERT在文本检索任务中的实践
- 2021-03-4:task04_NFM模型
- 美团外卖推荐智能流量分发的实践与探索
- Encoding History with Context-aware Representation Learning for Personalized Search(2020SIGIR)
- 【SIGIR22】使用反事实生成器来消除知识感知推荐中的虚假联系
Python pandas数据分列,分割符号固定宽度相关推荐
- Python Pandas –数据输入和输出
Pandas as a library can read and write data to a wide variety of sources. In this article, we would ...
- python pandas 数据探索
来源于: Kaggle Lending Club Loan Data数据可视化分析与不良贷款预测 对特征缺失值的处理 1.计算特征缺失值比例的函数: def draw_missing_data_tab ...
- Python pandas数据计数函数value_counts
value_counts介绍 value_counts是一种查看表格某列中有多少个不同值的快捷方法,并计算每个不同值有在该列中个数,类似Excel里面的count函数 其是pandas下面的顶层函数, ...
- python两个字符串数据可以复制吗_无论如何,是否要将Python pandas数据框中的单个数据中的数据复制到字符串或列表中以进行进一步处理?...
使用示例数据.请注意,由于复制和粘贴选项卡占用空格(因此使用sep ='\ s +',iso'\ t')并且我已将数据的第一行设置为列名(不使用header = None).可以使用join将一列连接 ...
- python pandas 数据透视表_python – Pandas数据透视表:列顺序和小计
小计和 MultiIndex.from_arrays的解决方案.最后 concat和所有数据帧, sort_index并添加所有总和: #replace km/h and convert to int ...
- Python pandas在读取csv文件时(linux与windows之间传输),数据行数不一致的问题
背景 最近在处理用户评论数据时,从Linux服务器上面用pandas导出的csv文件,下载到自己的Windows电脑,再用本地pandas读取时发现数据行数不一致的情况,比如在Linux服务器上面数据 ...
- 单元格内容分列多行_『如何将excel单个表格里的多行数据分列』
excel中怎样分列不规律的数据 1.我们打开 Excel 表的数据方式, 我们可以看到于歌曲的和对歌手数响应, 那么如果我们想把这个道路数据分成两个数据. 2.首先用鼠标点击列数据顶部, 列数据称为 ...
- 单元格内多个姓名拆分成一列_Excel如何将姓名分拆成姓和名两列(使用数据分列完成)...
Excel如何将姓名分拆成姓和名两列(使用数据分列完成) 时间:2016-02-28 作者:snow 来源:互联网 大家好今天给大家介绍的技能是如何将"姓名"分拆成&quo ...
- csv 20位数据 如何打开可以预览完整数字_干货Python Pandas 做数据分析之玩转 Excel 报表分析...
本篇文章选自作者在 GitChat 的分享,若有什么问题,可在公众号回复「小助手」添加小助手微信,邀请你进入技术交流群. 各位朋友大家好,非常荣幸和大家聊一聊用 Python Pandas 处理 Ex ...
最新文章
- Linux - SVN下载项目
- 配置mysql允许远程连接的方法
- redis3.0.3 安装与配置
- Python3 matplotlib的绘图函数subplot()简介
- 微服务架构设计模式~根据业务能力进行服务拆分
- java 中的doit(n)_CoreJava测试题(含答案).docx
- 中国剧本推理市场洞察2021
- 2017.8.14 分手是祝愿 失败总结
- java字符串替换的问题
- 企业网管服务器架设资料(极品中的极品)
- 随手记_思路历程_马原知识体系逻辑图解
- matlab iradon函数详解,如何处理iradon函数所得图像
- python数据分析收获与心得体会_初次数据分析--我的心得体会
- 狸窝全能视频转换器功能介绍
- 空间分析方法在计算机上的应用,常见的空间分析方法(很经典的总结)
- 宏电DTU配置教程和配置工具
- arcgis利用切片服务导出离线地图包(tpk文件)
- 近期每日学习与工作时间安排
- c语言文件操作可重入,C语言试题
- 深入浅出golang的chan
热门文章
- 清华最新发布的毕业生去向,够卷!
- 人列计算机的原理,从《三体》人列计算机到CMOS电路
- 关于谷歌浏览器页面出现光标闪动,鼠标的焦点没有消失解决
- Proxifer+BurpSuite 抓取PC客户端HTTP(s)数据包
- 【时序】TCCT:用于时间序列预测的紧耦合卷积 Transformer
- 飞卡日常进度之山外上位机的二值化模式和灰度模式
- 地胶地板施工工艺,地板胶怎么去掉
- openSUSE桌面环境日常软件推荐
- NDK是什么?(What is the NDK?)
- 最新计算机技术a类学校,计算机科技领域的23所院校排名,4所A类院校录取分数线达到A+...