这个问题算是群友答疑。如果说同事或者老板给你一堆这样的数据,你估计会抓狂,该怎么处理呢?

很多人学习python,不知道从何学起。
很多人学习python,掌握了基本语法过后,不知道在哪里寻找案例上手。
很多已经做案例的人,却不知道如何去学习更加高深的知识。
那么针对这三类人,我给大家提供一个好的学习平台,免费领取视频教程,电子书籍,以及课程的源代码!
QQ群:101677771

仔细观察上面数据可以发现,该数据有如下2个主要特点:

  • 每一行的数据长度不同。第一行和第三行有4个属性,第二行有5个属性。
  • 不同行的属性值,并不是对应排列。

解题思路剖析

你可能会想,直接用Excel分裂。其实并不可行,因为不同行的属性值,并不是对应排列。Excel分列导致的结果就是:不同的属性,存在于相同的行。

放弃Excel那条路之后,我就只能寻求Python的帮助了。我们要根据数据的特点,选择合适的数据存储方法。最终问题就转化为:构造数据源,然后创建DataFrame即可。

然后根据我们这个数据的特点,我选择构造字典组成的列表这样一个数据,并利用它来创建DataFrame。

观察我提供的这个案例和待解决的问题,简直异曲同工。我们同样可以将上述数据的每一行,都变成一个个键值对组成的字典。然后最外层用一个大列表,将所有的字典包含起来。

完整代码

1)首先需要构造练习数据

import pandas as pd
x = {"信息":["年龄:12;性别:女;身高:22;爱好:打球", "年龄:12;说明:历史数据;性别:女;身高:22;爱好:打球", "生日:2月3日;年龄:12;性别:女;爱好:打球"] }
df = pd.DataFrame(x)
df

结果如下:

2)构造字典组成的列表

tmps_list = []
for data in df["信息"].values: tmp_dict = {} for kv in data.split(";"): k, v = kv.split(":") tmp_dict[k] = v tmps_list.append(tmp_dict)
tmps

结果如下:

3)创建DataFrame

df = pd.DataFrame(tmps)
df

结果如下:

领导给了一堆无序杂乱的数据,我写了个Python自动化脚本相关推荐

  1. 领导给我一堆无序、杂乱的数据,我写了一个Python自动化脚本!

    问题抽丝剥茧 这个问题也算是群友答疑.如果说同事或者老板给你一堆这样的数据,你估计会抓狂,该怎么处理呢? 仔细观察上面数据可以发现,该数据有如下2个主要特点: ① 每一行的数据长度不同.第一行和第三行 ...

  2. python数据包分析_用python编写脚本分析网络数据包

    业务范围:QQ122353503---淘宝搜索店铺:小七软件园 1:MATLAB优化,数值计算,GUI界面设计/Simulink模拟仿真,模式识别等 2:电子电力系统仿真,通信,自动化,电气,FPGA ...

  3. Python 自动化:根据模板批量生成含指定数据的 word 文档

    作者:一只河马h 来源:简说Python 一.需求说明 在平时工作当中,经常需要处理文件,特别是Word,处理Word时会遇一类比较常见的场景:文档中大部分文字固定不变,小部分内容需要修改. 这时我们 ...

  4. Python自动化:根据模板批量生成含指定数据的word文档

    一.需求说明 在平时工作当中,经常需要处理文件,特别是Word,处理Word时会遇一类比较常见的场景:文档中大部分文字固定不变,小部分内容需要修改. 这时我们会机械的重复打开.修改.保存文档等一系列操 ...

  5. python构造icmp数据包_如何在python中构造ICMP数据包

    为了学习,我目前正在尝试创建一个简单的python porgram来向某个设备发送ICMP ping数据包.为了开始,我查看了python模块Pyping:https://github.com/Akh ...

  6. 小白学数据:教你用Python实现简单监督学习算法

    转载自 小白学数据:教你用Python实现简单监督学习算法 今天,文摘菌想谈谈监督学习. 监督学习作为运用最广泛的机器学习方法,一直以来都是从数据挖掘信息的重要手段.即便是在无监督学习兴起的近日,监督 ...

  7. 【Python零基础快速入门系列 | 03】AI数据容器底层核心之Python列表

    • 这是机器未来的第7篇文章 原文首发地址:https://blog.csdn.net/RobotFutures/article/details/124957520 <Python零基础快速入门 ...

  8. python怎么整理数据的_如何用 Python 整理数据?

    文章转载自公众号  林骥 , 作者 林骥 0. 序言 整理的意思,是整顿使之有条理,目标是让零散杂乱的数据变得井然有序. 许多分析数据的时间. 做数据分析工作,表面是在制作数据报表.提交分析报告,背后 ...

  9. python如何高效使用excel_高效办公必备:你加班做的 Excel数据汇总,我用Python一分钟搞定!...

    原标题:高效办公必备:你加班做的 Excel数据汇总,我用Python一分钟搞定! 广东优就业 IT互联网/资讯热点/技能干货 点左上方蓝字关注小U有礼物送~ 现如今无论是工作汇报.产品设计.后台设计 ...

最新文章

  1. 博客迁移至http://www.vlix.org/
  2. 有人工裁判,就会有争执
  3. OpenCV3编程入门(毛星云)之视频读取与播放
  4. OLEDB IMEX行数限制的问题
  5. 2017软件工程第三次作业--效能分析
  6. svn认证失败,解决方案
  7. 在Java web中使用json
  8. vb6在后台将窗体保存到图片_如何将寺库网多个商品图片一键分类保存到一个目录...
  9. Java的FTP协议级客户端实现详解
  10. Python键鼠操作自动化库PyAutoGUI简介
  11. linux终端安装mingw编译器_C/C++编译器MinGW的安装与配置
  12. C/C++中printf和C++中cout的输出格式
  13. tomcat下部署activemq(转)
  14. linux c 宏 文件名,C语言标准宏获取文件名、行号、函数名的方法以及#和##的用法...
  15. 2分钟搞定收货地址三级联动,数据易于维护,更新。
  16. 关于全国大学生软件测试大赛总结与反思
  17. MAC 软件安装打不开解决办法
  18. 语句摘抄——第13周
  19. 广电系统三八红旗集体推荐材料_三八红旗集体事迹材料
  20. 遇到女神应该使用什么样的暗恋思维

热门文章

  1. redis-数据类型一览
  2. django-索引1909
  3. 数据结构与算法-复杂的问题简单化
  4. jquery-加入购物车动画
  5. 修改kubelet启动参数
  6. 深入学习SpringMVC以及学习总结
  7. .NET应用程序管理服务AMS设计
  8. 5.11 学习日记,首页banner做好了
  9. StreamWriter、StreamReader 写读文件的两种方法
  10. 使用PostgREST的RestAPI操作之角色系统教程