大家好,我是辰哥(文末送书)

作为数据分析师,我们需要经常制作统计分析图表。但是报表太多的时候往往需要花费我们大部分时间去制作报表。这耽误了我们利用大量的时间去进行数据分析。但是作为数据分析师我们应该尽可能去挖掘表格图表数据背后隐藏关联信息,而不是简单的统计表格制作图表再发送报表。既然报表的工作不可免除,那我们应该如何利用我们所学的技术去更好的处理工作呢?这就需要我们制作一个Python小程序让它自己去实现,这样我们就有更多的时间去做数据分析。我们把让程序自己运行的这个过程称为自动化。

一、报表自动化目的

1.节省时间,提高效率

自动化总是能够很好的节省时间,提高我们的工作效率。让我们的程序编程尽可能的降低每个功能实现代码的耦合性,更好的维护代码。这样我们会节省很多时间让我们有空去做更多有价值有意义的工作。

2.减少错误

编码实现效果正确无误的话是是可以一直沿用的,如果是人为来操作的话反而可能会犯一些错误。交给固定的程序来做更加让人放心,需求变更时仅修改部分代码即可解决问题。

二、报表自动化范围

首先我们需要根据业务需求来制定我们所需要的报表,并不是每个报表都需要进行自动化的,一些复杂二次开发的指标数据要实现自动化编程的比较复杂的,而且可能会隐藏着各种BUG。所以我们需要对我们工作所要用到的报表的特性进行归纳,以下是我们需要综合考虑的几个方面:

1.频率

对于一些业务上经常需要用到的表,这些表我们可能要纳入自动化程序的范围。例如客户信息清单、销售额流量报表、业务流失报表、环比同比报表等。

这些使用频率较高的报表,都很有必要进行自动化。对于那些偶尔需要使用的报表,或者是二次开发指标,需要复制统计的报表,这些报表就没必要实现自动化了。

2.开发时间

这就相当于成本和利率一样,若是有些报表自动化实现困难,还超过了我们普通统计分析所需要的时间,就没必要去实现自动化。所以开始自动化工作的时候要衡量一下开发脚本所耗费的时间和人工做表所耗费的时间哪个更短了。当然我会提供一套实现方案,但是仅对一些常用简单的报表。

3.流程

对于我们报表每个过程和步骤,每个公司都有所不同,我们需要根据业务场景去编码实现各个步骤功能。所以我们制作的流程应该是符合业务逻辑的,制作的程序也应该是符合逻辑的。

三、实现步骤

首先我们需要知道我们需要什么指标:

指标

  • 总体概览指标

反映某一数据指标的整体大小

  • 对比性指标

  • 环比

相邻时间段内的指标直接作差

  • 同比

相邻时间段内某一共同时间点上指标的对比

  • 集中趋势指标

  • 中位数

  • 众数

  • 平均数/加权平均数

  • 离散程度指标

  • 标准差

  • 方差

  • 四分位数

  • 全距(极差)

  • 最大界减最小界

  • 相关性指标

  • r

我们拿一个简单的报表来进行模拟实现:

第一步:读取数据源文件

首先我们要了解我们的数据是从哪里来的,也就是数据源。我们最终的数据处理都是转化为DataFrame来进行分析的,所以需要对数据源进行转化为DataFrame形式:

import pandas as pd
import json
import pymysql
from sqlalchemy import create_engine# 打开数据库连接
conn = pymysql.connect(host='localhost',port=3306,user='root',passwd='xxxx',charset = 'utf8')
engine=create_engine('mysql+pymysql://root:xxxx@localhost/mysql?charset=utf8')def read_excel(file):df_excel=pd.read_excel(file)return df_excel
def read_json(file):with open(file,'r')as json_f:df_json=pd.read_json(json_f)return df_json
def read_sql(table):sql_cmd ='SELECT * FROM %s'%tabledf_sql=pd.read_sql(sql_cmd,engine)return df_sql
def read_csv(file):df_csv=pd.read_csv(file)return df_csv

以上代码均通过测试可以正常使用,但是pandas的read函数针对不同的形式的文件读取,其read函数参数也有不同的含义,需要直接根据表格的形式来调整。

其他read函数将会在文章写完之后后续补上,除了read_sql需要连接数据库之外,其他的都是比较简单的。

第二步:DataFrame计算

我们以用户信息为例:

img

我们需要统计的指标为:

#指标说明
单表图:前十个产品受众最多的地区

#将城市空值的一行删除
df=df[df['city_num'].notna()]
#删除error
df=df.drop(df[df['city_num']=='error'].index)
#统计    df = df.city_num.value_counts()

我们仅获取前10名的城市就好了,封装为饼图:

def pie_chart(df):#将城市空值的一行删除df=df[df['city_num'].notna()]#删除errordf=df.drop(df[df['city_num']=='error'].index)#统计df = df.city_num.value_counts()df.head(10).plot.pie(subplots=True,figsize=(5, 6),autopct='%.2f%%',radius = 1.2,startangle = 250,legend=False)
pie_chart(read_csv('user_info.csv'))

将图表保存起来:

plt.savefig('fig_cat.png')

要是你觉得matplotlib的图片不太美观的话,你也可以换成echarts的图片,会更加好看一些:

pie = Pie()
pie.add("",words)
pie.set_global_opts(title_opts=opts.TitleOpts(title="前十地区"))
#pie.set_series_opts(label_opts=opts.LabelOpts(user_df))
pie.render_notebook()

封装后就可以直接使用了:

def echart_pie(user_df):user_df=user_df[user_df['city_num'].notna()]user_df=user_df.drop(user_df[user_df['city_num']=='error'].index)user_df = user_df.city_num.value_counts()name=user_df.head(10).index.tolist()value=user_df.head(10).values.tolist()words=list(zip(list(name),list(value)))pie = Pie()pie.add("",words)pie.set_global_opts(title_opts=opts.TitleOpts(title="前十地区"))#pie.set_series_opts(label_opts=opts.LabelOpts(user_df))return pie.render_notebook()
user_df=read_csv('user_info.csv')
echart_pie(user_df)

可以进行保存,可惜不是动图:

from snapshot_selenium import snapshot
make_snapshot(snapshot,echart_pie(user_df).render(),"test.png")

保存为网页的形式就可以自动加载JS进行渲染了:

echart_pie(user_df).render('problem.html')
os.system('problem.html')

第三步:自动发送邮件

做出来的一系列报表一般都要发给别人看的,对于一些每天需要发送到指定邮箱或者需要发送多封报表的可以使用Python来自动发送邮箱。

在Python发送邮件主要借助到smtplib和email这个两个模块。

  • smtplib:主要用来建立和断开与服务器连接的工作。

  • email:主要用来设置一些些与邮件本身相关的内容。

不同种类的邮箱服务器连接地址不一样,大家根据自己平常使用的邮箱设置相应的服务器进行连接。这里博主用网易邮箱展示:

首先需要开启POP3/SMTP/IMAP服务:

之后便可以根据授权码使用python登入了。

import smtplib
from email import encoders
from email.header import Header
from email.utils import parseaddr,formataddr
from email.mime.application import MIMEApplication
from email.mime.multipart import MIMEMultipart
from email.mime.text import MIMEText#发件人邮箱
asender="PyDataStudio@163.com"
#收件人邮箱
areceiver="PyDataStudio@163.com"
#抄送人邮箱
acc="数据STUDIO@163.com"
#邮箱主题
asubject="谢谢关注"
#发件人地址
from_addr="PyDataStudio@163.com"
#邮箱授权码
password="####"
#邮件设置
msg=MIMEMultipart()
msg['Subject']=asubject
msg['to']=areceiver
msg['Cc']=acc
msg['from']="数据STUDIO"
#邮件正文
body="你好,欢迎关注@公众号:数据STUDIO,您的关注就是我继续创作的动力!"
msg.attach(MIMEText(body,'plain','utf-8'))
#添加附件
htmlFile = 'C:/Users/10799/problem.html'
html = MIMEApplication(open(htmlFile , 'rb').read())
html.add_header('Content-Disposition', 'attachment', filename='html')msg.attach(html)
#设置邮箱服务器地址和接口
smtp_server="smtp.163.com"
server = smtplib.SMTP(smtp_server,25)
server.set_debuglevel(1)
#登录邮箱
server.login(from_addr,password)
#发生邮箱
server.sendmail(from_addr,areceiver.split(',')+acc.split(','),msg.as_string())
#断开服务器连接
server.quit()

下载文件:

完全没问题!!!

赠书福利▊《Python自动化测试实战》
【内容简介】
  • 在转型过程中,主流自动化测试技术和应用场景的结合是非常重要的一环。《Python自动化测试实战》这本书从自动化测试理论入手,全面地阐述自动化测试的意义及实施过程。全文以Python语言驱动,结合真实案例分别对主流自动化测试工具Selenium、Robot Framework、Postman、Python+Requests、Appium等进行系统讲解。

  • 通过学习本书,读者可以快速掌握主流自动化测试技术,丰富测试思维,提高Python编码能力。本书实用性强,不仅是转型自动化测试方向的一本案头书,也是一本特别好用、实用的操练手册

作者简介

  • 鹿瑞峰,高级测试工程师,曾供职于华为、顺丰等互联网公司,担任测试经理、高级测试工程师等职务。博客园分享原创文章超过300篇,同时创建了“IT测试老兵”微信公众号,专注分享有关自动化测试技术的相关内容。

赠书规则赠送规则:通过留言点赞的方式送出,转发本文至朋友圈+文末留言,留言点赞数量最多的第1位读者将获得1本,随机抽1本。
附加规则:最近一个月中奖的本次不再送书,也给其他人一个中奖的机会!
开奖时间:11月12日20:00(周六)
注意事项:最终获赠者请在24小时以内添加辰哥微信												

Python办公自动化:制作报表并发送到邮箱相关推荐

  1. 用python制作报表

    本文将介绍Python如何制作报表,主要分为三个部分:导出Excel报表.导出PDF报表和生成前端统计图表. 导出Excel报表 数据报表是用表格.图表等格式来动态显示数据的一种方式,它的公式被描述为 ...

  2. 使用Python生成自动报表(Excel)以邮件发送

    数据分析师肯定每天都被各种各样的数据数据报表搞得焦头烂额,老板的,运营的.产品的等等.而且大部分报表都是重复性的工作,这篇文章就是帮助大家如何用Python来实现报表的自动发送,解放你的劳动力,可以让 ...

  3. 使用Python自动生成报表以邮件发送

    编程狗在线 自由的编程学习平台 数据分析师肯定每天都被各种各样的数据数据报表搞得焦头烂额,老板的,运营的.产品的等等.而且大部分报表都是重复性的工作,这篇文章就是帮助大家如何用Python来实现报表的 ...

  4. python实现抓取网页上的内容并发送到邮箱

    要达到的目的: 从特定网页中抓取信息,排版后发送到邮箱中 关键点: 下载网页,从网页里抓取出需要的信息 HTML排版 发送到指定邮箱 实现: 1.python下载网页 直接用库函数就可以实现 from ...

  5. 利用 Python 自动抓取微博热搜,并定时发送至邮箱

    点击上方"Python爬虫与数据挖掘",进行关注 回复"书籍"即可获赠Python从入门到进阶共10本电子书 今 日 鸡 汤 夜阑卧听风吹雨,铁马冰河入梦来. ...

  6. 软件测试|Python操作Excel制作报表,不要太方便

    前言 今天我们介绍的是Python操作Excel制作报表,我们需要用到的库是openpyxl,我们主要使用的功能有下列几个功能 插入与查询数据 分类数据统计 数据可视化 字体颜色修改 基本操作 表格初 ...

  7. ERP企业资源计划 用python实现制作MPS报表

    ERP企业资源计划 用python实现制作MPS报表 运行环境 题目 导入模块 用例1 用例2 显示制作结果 代码实现 运行环境 用pandas实现 运行:jupyter notebook 题目 编写 ...

  8. 用Python定时每日爬取天气并把结果发送到邮箱项目实例

    用Python定时执行一个程序,并且完成了一个每日爬取天气并把结果发送到邮箱的程序. import requests import smtplib import schedule import tim ...

  9. python窃取摄像头照片(摄像头拍照+邮箱发送+打包exe)

    一.思路 1.python调用摄像头拍照 python可以调用电脑的摄像头进行拍照,然后保存照片. 2.发送照片到指定邮箱 通过QQ邮箱官方网站获取授权码方法,将照片发送到指定的邮箱.最后将本地的照片 ...

最新文章

  1. 数据库性能优化—SQL优化十大原则
  2. python需要配置环境变量吗_python安装和配置环境变量
  3. Spring Aop(九)——基于正则表达式的Pointcut
  4. Centos7 之目录处理命令(八)
  5. 电子邮件正则表达式-集结号
  6. android studio for android learning (二十八) android基础知识
  7. 【Axure PR原型模板】微信公众小程序手机移动端高保真交互原型
  8. Findbugs使用指南及扫描内容解释
  9. android版本4.4.2导航,天敏D8+_rk3288_Android_4.4.2_kiui7_蓝光导航极速版
  10. 鼠标右键没有word、excel/右键不能新建word、ppt等office
  11. Cocos2dx 3.2移植到Android 完全可行的方法
  12. python中dot函数总结
  13. matlab 矩阵与向量乘法,性能:Matlab与C矩阵向量乘法
  14. 少儿培训python
  15. vb 计算机主板喇叭发声,主板蜂鸣器发声规律总结
  16. python深度学习入门-与学习相关的技巧
  17. python错误找回_python字典键错误无法恢复
  18. 【包邮送书活动】20211018期-开奖通知
  19. 一些常用的python绘图包
  20. javascript数组 去重

热门文章

  1. 个性篮球队名_你的篮球个性是什么
  2. C语言中的强符号和弱符号
  3. 杭州都有哪些靠谱点的互联网公司?
  4. 从“中央厨房”看媒体深度融合
  5. ​为什么冠状病毒的死亡率具有误导性?
  6. CentOS安装EPEL软件源
  7. python服务器环境搭建_python服务器环境搭建(2)——安装相关软件
  8. 【mmdetection小目标检测教程】三、使用sahi库切分高分辨率图片,一键生成coco格式数据集
  9. Spring 注解 属性赋值与自动注入装配
  10. 初始脚本一键搞定虚拟机