在目前的数据分析领域,常用的分析工具有excel、python等,这几乎已经成为共识,而面对excel和python,谁更适合数据分析,也确实一直被大家讨论。

Excel VS Python

excel不用多做介绍,办公必备的表格工具。关于python,这里简单说一下其背景:
python是一门开源的高级编程语言,拥有强大的社区支持和开发团队。这意味着在各个领域,python都有着丰富的第三方工具库,而且一直不断更新改进。另一方面,python作为胶水语言,有着简洁、易读、流畅、易维护、模块化的优良特性,并且轻松与其它编程语言及软件集成。

为什么python更适合用于数据分析?有以下几点理由:
1、分析过程可复现
使用python做数据分析,分析代码可以保存为脚本,有利于不断优化代码版本,并且让改进流程更加清晰。
在不改变数据源的情况下,代码输出的结果一致,不会随着时间和人员的变化而出现不同的分析结果,可复现性强。
2、更高的效率和扩展性
确实,excel被大多数人用于数据分析,但是面对大数据集和复杂运算,excel效率太低。
python在I/O、复杂计算、数据管道、自动化处理等方面更加快速,而且处理大数据的效率远高于excel。在性能优化方面,python也有更多操作的空间。
3、集成性
前面说过,python是一门胶水语言,可以与很多编程语言及应用集成。
比方说,python可以连接各种数据库,通过写入sql语句,对数据库数据进行提取、写入、更改的操作。
python还可以连接应用程序API,编写自动化脚本操作应用程序,如excel这样的软件,python有众多的库进行连接,十分高效。
在数据探索的过程中,python提供pandas这样的数据分析工具,帮助你更清晰快速地进行探索分析,并且有大量的可视化库来做可视化展示。
你可以轻松的读存xlsx、csv等数据格式文件,让数据操作灵活高效。

python实例应用

从数据管理系统里导出一家企业的电机运行CSV数据表,计算电机一个月内的负载率分布情况,可以通过以下代码进行处理:
CSV数据表

电机负载率分布代码

import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import glob
plt.rcParams['font.sans-serif'] = ['KaiTi'] # 指定默认字体
plt.rcParams['axes.unicode_minus'] = False # 解决保存图像是负号'-'显示为方块的问题
sum = 0
sum1 = 0
sum2 = 0
sum3 = 0
sum4 = 0
sum5 = 0
for i in glob.glob('金田*.csv'):a = pd.read_csv(i, encoding='gbk') #依次读取所在目录下的CSV文件b = np.array(a['负载率']) #读取列名为负载率的一列for i in b:if i > 0 and i < 9:sum1 += 1elif i == 9:sum2 += 1elif i > 9:sum3 += 1else:sum4 += 1sum5 += len(b) #负载率的总条数
sum = sum5 - sum4
print('负载率大于0小于9的个数为:',sum1)
print('负载率等于9的个数为:',sum2)
print('负载率大于9的个数为:',sum3)
print('负载率等于0的个数为:',sum4)
print('负载率不为0的总条数:',sum)
print('负载率大于0小于9的比率:{:.2%}'.format(sum1/sum))
print('负载率等于9的比率:{:.2%}'.format(sum2/sum))
print('负载率大于9的比率:{:.2%}'.format(sum3/sum))
c = ['小于9','等于9','大于9']
d = [sum1/sum,sum2/sum,sum3/sum]
plt.plot(c,d,linestyle=":",marker='o',color='r',label='负载趋势1')
plt.title("负载分布")
plt.legend(('负载趋势',))#转为元组的形式加上逗号,就能全部显示了
plt.show()

点击运行,得到如下结果:


以上的程序运行结果即为负载率分布值及负载分布的趋势变化图,点击运行按钮后只需几秒钟就能获取结果,比起使用电子表格来处理,python的处理效率要高很多。

用python对CSV文件中的数据进行统计分析相关推荐

  1. python怎么读取csv的一部分数据_python批量读取csv文件 如何用python将csv文件中的数据读取成数组...

    如何用python把多个csv文件数据处理后汇总到新csv文件你看这月光多温柔,小编转头还能看见你,一切从未坍塌. 可以用pandas读取数据,首先把文件方同一个文件价里,然后对当前文件价的所有内容循 ...

  2. python对csv文件中的数据进行分类_使用Python读取csv文件并进行分类存储

    同学叫我帮忙用Python做csv表格分类,整理一下遇到的问题及解决方案 原生数据文件TEST.csv: 如图我需要根据G列内容,分别对A,B,C进行分类到A.csv,B.csv,C.csv 上代码, ...

  3. python对csv文件中的数据进行分类_python 数据处理 对csv文件进行数据处理

    数据如下图: 用python对数据进行处理: #读取csv文件内容并进行数据处理 import os import csv import datetime import re from itertoo ...

  4. python对csv文件中的数据进行分类_利用Python对csv文件中的数据进行排序

    代码如下: #导入包 import pandas as pd from pandas import DataFrame,Series #设置路径 path='C:\\Users\\jyjh\\Desk ...

  5. python获取股指_用Python读取csv文件中的沪深300指数历史交易数据

    保存路径:D:\python\用Python读取csv文件中的沪深300指数历史交易数据 程序名称:readcsvhs300.py: 数据名称:沪深300指数历史交易数据.csv: 开发环境:Win7 ...

  6. 大数据_MapperReduce_从CSV文件中读取数据到Hbase_测试---Hbase工作笔记0022

    技术交流QQ群[JAVA,C++,Python,.NET,BigData,AI]:170933152 然后我们继续看,这里我们写完以后,一会咱们去测试一下. 可以看到上一节我们已经写了,从csv文件中 ...

  7. java将数据写入csv文件,从csv文件中读取数据

    全栈工程师开发手册 (作者:栾鹏) java教程全解 java将数据写入csv文件,从csv文件中读取数据 测试代码 public static void main(String[] arges){/ ...

  8. 从csv文件中导入数据到MySQL数据库

    从csv文件中导入数据到MySQL数据库 转: 一.Workbench客户端导入(8.0.11基本导不全且速度奇慢) 1.点击如下图标创建数据库(非必要) 2.在表类上右键导入 二.SQL语句导入(可 ...

  9. R语言:从 csv 文件中读取数据,然后将数据写入 csv 文件

    在 R 中,我们可以从存储在 R 环境外部的文件读取数据.我们还可以将数据写入将由操作系统存储和访问的文件中.R可以读取和写入各种文件格式,如csv,excel,xml等. 在本章中,我们将学习从 c ...

最新文章

  1. c# 调用 WINDOW API DLL
  2. 简单的OSPF多区配置
  3. 6大设计原则之依赖倒置原则
  4. crackme之018
  5. pytest自动化6:pytest.mark.parametrize装饰器--测试用例参数化
  6. 论文学习6-(M2DNE)Temporal Network Embedding with Micro- and Macro-dynamics
  7. 可输入div的问题探讨
  8. QByteArray使用方法举例
  9. LXC基本架构及用法(六)
  10. python单词倒排_【原创】python倒排索引之查找包含某主题或单词的文件
  11. SET FOREIGN_KEY_CHECKS = 0
  12. 复杂网络社区划分方法综述
  13. Xmodem/Ymodem/Zmodem协议详解
  14. “以图搜图”引擎及网站合集
  15. 1-8代酷睿全部中招,英特尔处理器再曝漏洞
  16. 我只想保持本色,和少年的心气。
  17. 广搜4 ——Cheese
  18. Android监听消息(二)——电话及短信监听
  19. SystemUI Q 移植到android studio开发
  20. Cognos 配置启动错误

热门文章

  1. win10环境下搭建IIS图片服务器
  2. UOJ #311「UNR #2」积劳成疾
  3. 【NISP一级】1.3 网络空间安全政策与标准
  4. android删除本地图片,Android之删除图库照片
  5. 计算机使用计数制是,进位计数制
  6. 娃娃乐学拼音软件许可及服务协议
  7. win10+yolov5尝鲜体验
  8. 如何使用python下载B站视频
  9. cas112592-50-4/四溴苯基卟啉镍/nickel(II) tetra(p-Br-phenyl)porphyrin/分子式:C44H24Br4N4Ni++/分子量:986.99800
  10. ReactJS :我就是想把代码和HTML混在一起!