利用python学习了简单一维数组和二维数组,明白了集合、数组、字典大概的关联,并学会从中点用不同的数组类型进行更好的分析。

读取excel文件,开始进行最简单的数据清洗。

将购药时间重新命名为销售时间,即python可以实现对列名称进行更换。

因为最开始引用的数据格式全部为文本格式,现在需要将销售数据、应收金额、实收金额转换为浮点数据进行运算。

还需要进行一步:对数据表中的空值进行删除,以便后续处理。

函数的那一步意义为:将销售时间‘2018-01-01 星期五’用split函数进行分列,提取分析所需的信息,即‘2018-01-01’。其中用到了for循环和自定义函数。

然后将销售时间数据的格式转换为日期格式,便于进一步的统计分析。(注意:在这一步的时候可能会出现日期格式数据出现控制,所以需要将空值进行删除)

在完成数据格式转换以后,用file.dtypes可以看到每一列的数据格式。

接下来将数据按照销售时间的升序排列。

数据清洗完成后,可以开始数据分析或者数据运算。

这里用到了分组功能,因之前已经把销售时间数据变为了日期数据,所以可以根据月份分类,直接可以显示各个月份的销售数量、应收、实收金额。

应用以上内容,我将针对某微信公众号在2019年的数据进行简单统计分析。首先导入excel文件。

删除空值,将阅读量、当日涨、掉粉量和分享量的数据转为浮点型,把日期数据转为日期格式。

根据每个月的阅读量、分享量、当日涨粉、掉粉情况进行统计,并计算了2019年总的阅读量。

根据以上的学习,大概了解了用python清洗数据的过程,可以类比excel来想。在excel中可能运用数据透视表就可以很简单运行的东西,在python中对应的相对较复杂的变成语句,这个时候可以结合自己的熟练程度,进行不同软件的选择。在统计分析方面,python有固定的格式,可能以后会学到不同的语句。

在python语句运行中,需要特别小心,可能前一个语句重复运行尽毁导致下一个语句的无法运行,要更加细心。

python 数组升序_python简单数据清洗和分析相关推荐

  1. Python数组遍历的简单实现方法

    这篇文章主要介绍了Python数组遍历的简单实现方法,结合实例总结分析了Python针对数组的元素,索引常用遍历技巧,需要的朋友可以参考下 本文实例总结了Python数组遍历的简单实现方法.分享给大家 ...

  2. python提取数组元素_python简单获取数组元素个数的方法

    python简单获取数组元素个数的方法 更新时间:2015年07月13日 17:54:46 作者:pythoner 这篇文章主要介绍了python简单获取数组元素个数的方法,实例分析了Python中l ...

  3. python考勤记录_python连接中控考勤机分析数据

    用python连接中控考勤机. 下载并分析数据,把结果邮件给人事. SDK包建议用32位的,在win7 64位系统上用64位开发包不行,用32可以. python还要pywin32 注意版本,我这用的 ...

  4. python数组展示_python 显示数组全部元素的方法

    python 显示数组全部元素的方法 如下所示: import numpy as np np.set_printoptions(threshold='nan') 以上这篇python 显示数组全部元素 ...

  5. python数组定义_python定义数组

    广告关闭 腾讯云11.11云上盛惠 ,精选热门产品助力上云,云服务器首年88元起,买的越多返的越多,最高返5000元! 一.一维数组 1. 直接定义matrix=2. 间接定义matrix=print ...

  6. python音频 降噪_Python | 简单的扩音,音频去噪,静音剪切

    原标题:Python | 简单的扩音,音频去噪,静音剪切 之前一段时间一直在搞数字语音识别,在训练算法上耗费了很多时间,但结果不尽人意.后来才发现自己一直忽视了音频预处理的一步,于是转而囫囵吞枣般学习 ...

  7. python 估值模型_Python实现LRFM模型分析客户价值

    1. 分析背景 这是一份某电商平台的销售数据,数据包含2010年4月22到2014年7月24的销售数据.分析该销售数据,可以发现客户价值. 现利用KMeans聚类实现LRFM模型来分析客户的价值,便于 ...

  8. python错误捕获例程_python 错误捕获机制分析

    python语言是编程中使用率在Top 3之内的语言.python语言以灵活与简单著称,那么越是灵活的语言越需要判断出错的功力. 简单示例 以下是一个简单的错误程序,被除数不可为0,那么看看该代码的执 ...

  9. python数组越界_python数组越界

    Numpy入门 标题中的英文首字母大写比较规范,但在python实际使用中均为小写. 2018年7月23日笔记 0. 学习内容: Python科学计算库:Numpy需要掌握的知识: 1.Numpy简介 ...

最新文章

  1. 判断两个树是否相等和判断tree1是否包含tree2 python实现
  2. localStorage、sessionStorage、Cookie的区别及用法
  3. socket 获取回传信息_基于netty框架的socket长连接负载均衡解决方案 oswl
  4. 计算机更新80072f76,win10系统出现错误代码0x80072f76的解决方法
  5. Spring MVC同一方法返回JSON/XML格式
  6. 关于计算机的英语作文300,关于大学英语作文300字7篇
  7. 为什么kafka使用磁盘而不是内存
  8. extern 全局变量在不同的文件使用方法(static)
  9. mysql explain语句_Mysql explain 语句详解
  10. python切片读取数据_在Python中读取、切片和重组数据文件blockbyblock
  11. spring 事务传播行为类型
  12. ubuntu10下Eclipse中无法输入中文
  13. Delphi 实现多国语言
  14. 免费听歌下载歌曲的几个网站
  15. 基于opencv的图像拼接
  16. 【论文精读】Grounded Language-Image Pre-training(GLIP)
  17. 模拟电路9(微变等效电路法对共射基本放大电路进行分析)
  18. 盘点招招毙命的29种USB攻击方式
  19. 并行计算:openMP(一)—— parallel,for,sections指令的用法
  20. 2023-2028年中国燕麦奶行业市场预测与投资规划分析报告

热门文章

  1. 两个月番茄组长的收获总结
  2. 谷歌BERT预训练源码解析(二):模型构建
  3. LeetCode简单题之检查是否所有字符出现次数相同
  4. AI框架外部用户贡献代码
  5. MindArmour差分隐私
  6. 各种经典透镜投影模型
  7. centos7 安装 Mysql 5.7.28,详细完整教程
  8. CentOS7系统下bower 命令权限问题
  9. 前端面经笔记 2021.8.28
  10. ‘utf-8‘ codec can‘t decode byte 0xa8 in position 1210: invalid start byte报错解决