[Power Query] 数据的拆分、提取与合并
在数据整理阶段,经常需要对数据进行拆分、提取与合并
【转换】和【添加列】选项卡都有拆分列、合并列以及提取功能
两者的区别在于执行【转换】选项卡中的提取和合并列操作后,原列不保留;执行【添加列】选项卡中的提取和合并列操作后,原列保留,生成新的列
1.数据拆分
数据的拆分是指将一列的内容拆分到多列中
注意:不是所有的数据都可以拆分,拆分的依据是按照特定分隔符或字符数,适用于拆分具有一定排列规律的字符串,方便用户对数据进行二次分类,便于后续的数据分析使用
【转换】|【拆分列】选项下各项操作如下所示
当点击【按分隔符】拆分时,会弹出"按分隔符拆分列"命令窗口
1.选择或输入分隔符
指定按什么标准对数据进行拆分,默认提供了5种分隔符:冒号、逗号、等号、分号和空格。如果数据列中没有上述分隔符,我们可以自定义分隔符,如输入竖线、星号、破折号、斜线等不同类型的符号
2.拆分位置
用来指定数据提取方式
①最左侧的分隔符
从当前列最左侧字符开始,当指定的分隔符第一次出现时,就对当前文本以分隔符为界定拆分成两个数据列
②最右侧的分隔符
从当前列最右侧字符开始,当指定的分隔符第一次出现时,就对当前文本以分隔符为界定拆分成两个数据列
③每次出现分隔符时
可以将当前文本列拆分成多列,即每出现一次分隔符,其左右两边的文本就会被拆分,然后独立存储在相对应的数据列中
3.高级选项
①拆分为列
拆分出来的文本数据将以列的方式进行存储(默认)
②拆分为行
拆分出来的数据会作为新的行插入当前文本列中
4.引号字符
仅仅对CSV类型文件起作用
CSV文件是一种字符分隔符文件,对于列中数据的存储有一个规定,如果某一行数据包括空格、双引号、逗号等特殊字符,就需要在该字符串外围使用一对双引号进行包裹,CSV文件中的引号字符会被作为字符分隔符舍弃掉,不做保留
5.使用特殊字符进行拆分
如果需要按照<Tab>键、回车符、换行和不间断空格对数据进行拆分,可以选择此项
练习案例
数据源
问题:将"店铺"字段拆分成城市和店铺名称两个字段
具体操作步骤如下所示
步骤1:在Power Query中,选中"店铺"列,选择【添加列】|【重复列】选项,复制店铺列
步骤2:选中"店铺-复制"列,选择【转换】|【拆分列】|【按字符数】选项,输入字符数2,选择拆分模式"一次,尽可能靠左",单击【确定】按钮
步骤3:拆分后的字段将城市和店铺名称分为两列,双击列名称可以分别自定义修改列名为"城市"和"店铺名"
2.数据提取
数据的提取是指从文本数据中提取某些需要的字符,可按照长度、首字符、结尾字符、范围等方式来提取字符
注意:提取字符操作之前,要检查数据类型是否是文本型,日期型数据是无法提取的
选择方式 | 具体含义 |
长度 | 提取字符串长度 |
首字符 | 从左开始提取 |
结尾字符 | 从右开始提取 |
范围 | 从中间开始提取 |
分隔符(之前/之后/之间)的文本 | 提取分隔符控制的文本位置 |
练习案例
数据源
问题:对"销售单编号"列提取年月日信息
具体操作步骤如下所示
步骤1:在Power Query查询编辑器中,选中"销售单编号"列,检查数据类型是否为文本
步骤2:选择【添加列】|【提取】|【范围】选项,输入起始索引值9(起始索引为要提取的字符前面的字符数),字符数为10(年月日中间的反斜线/也包含在内),单击【确定】按钮
步骤3:将提取的年月日字段名修改为"日期",将数据类型修改为日期型,最终呈现结果如下所示
3.数据合并
数据的合并是将多列数据合并到一列中
在Power Query中选择需要合并的列,然后在选项卡中单击【合并列】,弹出"合并列"对话框,可以设置合并列之间的分隔符
注意:如果选择【转换】选项卡中的【合并列】,原列将被删除;如果选择【添加列】选项卡中的【合并列】,原列将被保留
练习案例
数据源
问题:将"城市"列和"店铺名"列合并,横线作为分隔符
选择【添加列】|【合并列】选项,弹出"合并列"命令窗口,分隔符下选择"自定义",下一行填写"-",点击【确定】按钮
合并结果如下图所示
[Power Query] 数据的拆分、提取与合并相关推荐
- [Power Query] 数据的透视与逆透视
在日常工作中,很多源数据表是二维表,虽然易于阅读,但不适合数据分析,往往需要将其转换为一维表,在Power Query中通过逆透视功能就能轻松实现上述功能 数据的透视与逆透视本质上就是用于二维表和一维 ...
- [Power Query] 数据类型转换
Power BI的数据类型包括数值型.日期/时间类型.文本型.True/False类型等 注意:Power BI处理数据的逻辑是列式处理,所以要求每一列的数据类型都必须真实反映数据的情况 当数据被加载 ...
- [Power Query]数据转置与反转行
数据的转置 数据行列的转换是将行变成列,列变成行,即数据的转置 数据源 某公司月度发货表 实现数据转置的具体操作步骤如下所示 步骤1:将数据源导入到Power BI Desktop,单击[转换数据]选 ...
- Power Query简介(超级查询:获取与整理数据)
提要:总结一下前辈大神们的内容,方便自己查询 参考: PowerQuery简介 作用:通过访问不同数据源,再对数据进行清洗.整理.是数据分析的先锋. 一.Power Query的常用功能 多表格合并, ...
- 使用Pyecharts进行全国水质TDS地图可视化全过程2:使用Power Query 进行百万行级别数据匹配
简介:本文介绍使用Excel Power Query进行数据匹配.利用这种方式,可以在几分钟内完成百万级别数据量的匹配. 在TDS可视化地图项目中,我们的原始数据没有TDS和具体安装地址的对应,我们 ...
- Power Query数据清洗的常用操作
1.提升标题 在Excel中第一行为标题行,从第二行开始才是数据,但在Power Query中,从第一行开始就需要是数据记录,标题在数据之上.一般情况下,Power Query会自动完成提升这个步骤, ...
- Power Query 自学教程
挖坑很久都没填,突然发现这篇文章阅读量很高,大半年过去了,虽然距离Power Query大神还有很远很远,但是通过学习和摸索,勉强算得上能够熟练操作80%+常用功能. 在使用Power Query半年 ...
- excel+power query进行文本数据拆分和提取
我的博客之前分享了pandas中文本数据的拆分和提取 由于数据量不大,我们也可以使用excel和它自带的插件power query进行同样的处理. 原始数据如下: 数据来源见此贴 登录爬取拉勾网2.0 ...
- 表头合并_多个Excel表格合并数据麻烦?试试Power Query轻松帮你解决
Hi!大家好!欢迎来到小龙自修室! 又到了小龙分享时间!(今天的内容有点多,希望各位看官一定要看到最后!有惊喜) 上一篇文字小龙和大家一起制作了一个限定数据内容录入的电子表格,我的表格我做主! 表格做 ...
最新文章
- AI开放只是幌子?科技巨头边承诺开放边申请专利
- 第二届清华大学项目管理精英训练营【敏捷个人】分享
- JNDI数据源的连接属性
- IOS XCode11开发嵌入网页
- HTML5 编辑 API 之 Range 对象(一)
- android 动态设置View的高度和宽度,ViewTreeObserver使用
- securecrt 乱码_SecureCRT远程连接Linux,配置端点和字节码
- 完美解决xhost +报错: unable to open display 装oracle的时候总是在弹出安装界面的时候出错...
- 数组c语言什么时候学的,C语言学习之数组
- Java新手之Java 从代码到运行的过程
- linux学习第一课:liunx概论
- ELK + Filebeat日志分析系统安装
- Unity物理引擎基础优化准则
- Unity PlayerSetting Android打包设置介绍
- 世界上第一部智能手机27岁了
- PCB的paste与solder层
- 实现语音对讲_报警联防子系统 | 实现一键式视频语音紧急求助
- 现代计算机网络的前沿技术,现代计算机网络的前沿技术分析
- 计算机二级是wpsoffice高级应用吗,考计算机二级ms office高级应用但是自己电脑上office软件都是wps 这和word ppt excel 软件有区别吗...
- 数据分析师如何搭建数据运营指标体系?
热门文章
- python答疑群_吾爱Python群群友问题答疑
- 微信开发的CreateTime
- MYSQL 如何用update语句 更新 某个字段,让字段值递增
- 数字藏品是什么:数藏app开发
- sed awk 样例
- “泻药,人在知乎,刚吃月饼”,众大V吃定制月饼后腹泻,知乎道歉
- 四川计算机专业最好的学校,四川2021年计算机学校有哪些专业比较好
- 打开html的数据空白,网页打开后没有内容只有空白,换了浏览器也是一样空白总是出现一些? 爱问知识人...
- html5实现的盲打高手游戏代码
- “魔幻”的直播带货:一夜血亏100万,依然有无数人入局!