如何利用Python实现工作中的自动化

“偷懒还能干完活,才是本事”

帅张发了一篇《工作要学会偷懒》,深感赞同。

有些事情既然定期都要处理,就没有更好的处理方式?能自动化么?
工作要学会偷懒,尤其对于一些大量重复的工作,第一感觉就要想到如何偷懒。 怎么偷懒呢? 做一点简单的编程工作就可以了。

我总结了一些在工作中非常常见的例子,将源码整理好供参考。

这类工作大部分是重复性工作,但占据了你比较多的时间,有时候用蛮力做的事情,可以有更省时省力的办法。
作为一名优秀的社会主义接班人,肯定都会有将工作任务自动化的意识,于是我去了解了一下身边不同岗位(HR、产品、运营、市场、数据分析师等)每天需要面对的重复性劳动(肯定会有不全,各位大佬不要喷我~)

今天我来分享一下在工作是实际会遇到的情况,其实我们不用吭哧吭哧地埋头干表格,也不用拼死平活地理数据,更不用机械式地点击各个启动和确认按钮,掌握一些自动化程序会让你的工作更加高效。

那么如何将这些统统实现呢?

我将这些分为以下几类,大家可以自行评估,各取所需:

如果你喜欢的话,分享让更多的人看到~

系统录入自动化

由于你经常需要不断的将一些信息录入系统,每一次录入的过程中你可能需要不断的点击一些按钮,面对这种情况,完全可以写一个自动脚本,每次代替你来执行这些点击的行为。

这里我们需要用到splinter:

pip install splinter

这里写了一个自动登录邮箱的脚本,可以实现文本输入和网页点击:

#coding=utf-8
import time
from splinter import Browserdef splinter(url):browser = Browser()#login 126 email websizebrowser.visit(url)#wait web element loadingtime.sleep(5)#fill in account and passwordbrowser.find_by_id('idInput').fill('xxxxxx')browser.find_by_id('pwdInput').fill('xxxxx')#click the button of loginbrowser.find_by_id('loginBtn').click()time.sleep(8)#close the window of browerbrowser.quit()if __name__ == '__main__':websize = 'https://mail.163.com/'splinter(websize)

同理可以写一个简单的游戏挂机脚本,游戏挂机脚本,无非就是自动移动鼠标,自动点击,进行重复操作,所以,第一步就是如何控制鼠标。

import win32api
import time
def move_click(x, y, t=0):  # 移动鼠标并点击左键win32api.SetCursorPos((x, y))  # 设置鼠标位置(x, y)win32api.mouse_event(win32con.MOUSEEVENTF_LEFTDOWN |win32con.MOUSEEVENTF_LEFTUP, x, y, 0, 0)  # 点击鼠标左键if t == 0:time.sleep(random.random()*2+1)  # sleep一下else:time.sleep(t)return 0#测试
move_click(30, 30)def resolution():  # 获取屏幕分辨率return win32api.GetSystemMetrics(0), win32api.GetSystemMetrics(1)

值得注意的是,一定要在管理员权限下的cmd中运行,否则点击无效。

这个时候,你已经可以写个循环,不停地点击屏幕上不同的几个点,最基础的挂机脚本就实现了。

不是在犯罪的道路上越走越远,就是在成长的道路上越走越远
更高级的游戏外挂:
https://github.com/JamesRaynor67/jump

Excel自动化处理

Excel合并

在实际应用中可能会有不同月份的数据或者不同周的报告等等的Excel数据,都是单个独立的文件,如果想要整体使用的话就需要合并一下,那么如何利用python把指定目录下的所有Excel数据合并成一个文件呢?

思路:利用python xlrd包读取excle文件,然后将文件内容存入一个列表中,再利用xlsxwriter将内容写入到一个新的excel文件中。

#-*- coding: utf-8 -*-#将多个Excel文件合并成一个
import xlrd
import xlsxwriter#获取excel中所有的sheet表
def getsheet(fh):return fh.sheets()#获取sheet表的行数
def getnrows(fh,sheet):table=fh.sheets()[sheet]return table.nrows#读取文件内容并返回行内容
def getFilect(file,shnum):fh=open_xls(file)table=fh.sheets()[shnum]num=table.nrowsfor row in range(num):rdata=table.row_values(row)datavalue.append(rdata)return datavalue

或者直接用concat+一个循环来实现:

for i in var_list:df_0 = data[['var_1','var_2','var_3','var_4',i]][data[i]=='信息']df_0['month'] = date_replace(i)df_0 = df_0[['var_1','var_2','var_3','var_4','var_5']]li.append(df_0)writer = pd.ExcelWriter(r'C:\Users\mapping.xlsx')
df = pd.concat(li)
df.to_excel(writer,'Sheet1',index=False,header = None)

Excel中添加数据图表

整理好excel文件后下一步需要做的是处理文件里的数据,根据数据来生成一些自己需要的图表:

import xlsxwriter#设置一个例子
data = [20, 45, 26, 18, 45]#创建表格
workbook = xlsxwriter.Workbook("temp.xlsx")
worksheet = workbook.add_worksheet("data")#添加数据
worksheet.write_column('A1', data)#创建图表
chart = workbook.add_chart({'type': 'line'})#图表添加数据
chart.add_series({'values': '=data!$A1:$A6','name': '图表名称','marker': {'type': 'circle','size': 8,'border': {'color': 'black'},'fill': {'color': 'red'}} ,'data_labels': {'values': True},'trendline': {'type': 'polynomial','order': 2,'name': '趋势线','forward': 0.5,'backward': 0.5,'display_equation':True,'line': {'color': 'red', 'width':1, 'dash_type': 'long_dash'}}
})worksheet.insert_chart('c1', chart)
workbook.close()

实现效果:

这部分图文来自网络,侵删。

word关键信息提取

假设你收到1万份简历,你想先根据学校做一些筛选,这时候利用python将大量的简历进行信息汇总,只提取关键信息用excel查看起来更加方便。

docx文件自己本身是压缩文件,打开压缩包之后竟然发现里面有个专门存储word里面文本的文件。
那么步骤就变得简单了:

  1. 打开docx的压缩包
  2. 获取word里面的正文信息
  3. 利用正则表达式匹配出我们想要的信息
  4. 将信息存储到txt中(txt可以用excel打开)
  5. 批量调用上述过程,完成一万份简历的提取工作
    利用正则匹配获取关键信息:
import re
def get_field_value(text):value_list = []m = re.findall(r"姓 名(.*?)性    别", table)value_list.append(m)m = re.findall(r"性    别(.*?)学    历", table)value_list.append(m)m = re.findall(r"民 族(.*?)健康状况", table)value_list.append(m)    '''此处省略其他字段匹配'''return value_list

后台回复简历获取完整代码,参考资料:
https://blog.csdn.net/geoker/article/details/80149463

自动化运营监控

在平时的工作中,一定会有对运营情况的监控,假设你管理一家店铺,那么一些关键指标肯定是你需要每天查看到的,比如店铺访问数,商品浏览数,下单数等等,这个时候不用每天重复地去统计这些数据,这需要写一个自动化程序,每天将数据保存在固定的文件夹下就可以实现报表的实时监控。

如果你的数据来源是线下文件:
那么可以利用python操作线下文件将其载入数据库
然后通过数据库对数据进行处理
再利用python输出结果

from impala.dbapi import connect
from impala.util import as_pandas
import datetimeconn = connect(host='host',port=21050,auth_mechanism='PLAIN',user='user',password='password')
#host:数据库域名
#user:数据库用户名
#password:数据库密码
df_data = pd.read_excel('temp.xlsx')rows =[]
for index, row in df_data.iterrows():rows.append('('+'"'+str(row['case_id']).replace('nan','null')+'"'+','+'"'+str(row['birth_date'])+'"'+')'+',')a= '''INSERT into table(case_id, birth_date)values '''
for i in rows:a += i
a = a[:-1]cursor1 = conn.cursor()
cursor1.execute(a)
cursor1.close()
conn.close()
print('成功导入数据至数据库...')
del a
del rows

如果你的数据来源是线上文件(存在数据库)
那可以直接利用python链接数据库进行一些列的操作
然后导出你所需要的结果

import sql   #sql是封装的sql文件
sql_end = sql.sql_end
cursor1 = conn.cursor()
for i in sql_end.split(';'):print(i)cursor1.execute(i)
cursor1.close()
conn.close()
print('程序运行结束,请执行下一步。')

python连接数据库:
https://blog.csdn.net/weixin_42213622/article/details/86523400

自动发送邮件

使用Python实现自动化邮件发送,可以让你摆脱繁琐的重复性业务,节省非常多的时间。
数据分析师经常会遇到一些取数需求,有些数据需求是每天都需要的,有些数据需求是每周一次的。对于这些周期性的数据需求,每次都重复性地手动导出这些数据,并回传给需求方,是很繁琐且浪费时间的。所以完全可以设置自动邮件来解决。
"Talk is cheap, show you the code"
常见的邮件肯定有三部分:
1、正文
2、图片
3、附件
OK
导入我们需要用到的包

from email.mime.text import MIMEText
from email.mime.multipart import MIMEMultipart
from email.mime.image import MIMEImage
import smtplibmsg = MIMEMultipart()

在邮件中插入正文:

##在邮件中插入文本信息
df_text='''<html><body><p>   Hi all ,</p><p>   这是一个测试邮件,详情请参考附件 </p><p>   情况如下图: </p></body></html>'''
msgtext = MIMEText(df_text, 'html', 'utf-8')
msg.attach(msgtext)

如果你需要插入图片,利用同样的方法,在邮件中插入图片:

##在邮件中插入图片信息
image = open('temp.jpg','rb')
msgimage = MIMEImage(image.read())
msg.attach(msgimage)
在邮件中插入附件:
##在邮件添加附件
msgfile = MIMEText(open('temp.xlsx', 'rb').read(), 'base64', 'utf-8')
msgfile["Content-Disposition"] = 'attachment; filename="temp.xlsx"'
msg.attach(msgfile)

剩下的就是设置一些邮件参数来发送邮件:

#设置邮件信息常量
email_host= ''  # 服务器地址
sender = '' # 发件人
password ='' # 密码,如果是授权码就填授权码
receiver = '' # 收件人

发送邮件:

try:smtp = smtplib.SMTP(host=email_host)smtp.connect(email_host)smtp.starttls()smtp.login(sender, password)smtp.sendmail(sender, receiver.split(',') , msg.as_string())smtp.quit()print('发送成功')
except Exception: print('发送失败')
然后将你的任务设置定时执行就可以轻松实现啦

实现效果:

平时的工作中,真的有太多可以去自动化的任务,由于经验受限这里不能一一举例说明,只能尽量分享一些我遇到过或者听说过的例子。

希望大家都越来越高效,边偷懒边完成工作~

大家如果有特别想要了解或者实现的功能,在文末留言或者私信,我可以针对一个点写得更详细,将完整实现方式分享给大家。

建议收藏,不定时更新更完善的功能。
如果你喜欢的话,分享出来让更多的人看到~

如何利用Python实现工作中的自动化相关推荐

  1. python在工作中怎么用_如何用python在工作中“偷懒”

    原标题:如何用python在工作中"偷懒" "偷懒还能干完活,才是本事 " 有些朋友在工作中会有这样的困惑:明明我从早忙到晚,为什么得到的评价还不高? 要知道, ...

  2. python 物理学中的应用_利用python求解物理学中的双弹簧质能系统详解

    前言 本文主要给大家介绍了关于利用python求解物理学中双弹簧质能系统的相关内容,分享出来供大家参考学习,下面话不多说了,来一起看看详细的介绍吧. 物理的模型如下: 在这个系统里有两个物体,它们的质 ...

  3. python在日常工作处理中的应用-python在工作中的应用场景介绍

    python在工作中的应用场景介绍 发布时间:2020-04-21 14:44:30 来源:亿速云 阅读:277 作者:小新 今天小编给大家分享的是python在工作中的应用场景介绍,相信很多人都不太 ...

  4. python代码物理_利用python求解物理学中的双弹簧质能系统详解

    前言 本文主要给大家介绍了关于利用python求解物理学中双弹簧质能系统的相关内容,分享出来供大家参考学习,下面话不多说了,来一起看看详细的介绍吧. 物理的模型如下: 在这个系统里有两个物体,它们的质 ...

  5. python excel绘图-利用python在excel中画图的实现方法

    一.前言 以前大学时候,学EXCEL看到N多大神利用excel画图,觉得很不可思议.今个学了一个来月python,膨胀了就想用excel画图.当然,其实用画图这个词不甚严谨,实际上是利用opencv遍 ...

  6. python 表格格式输出_利用python对excel中一列的时间数据更改格式操作

    问题场景:需要将下列的交期一列的数据格式更改成2019/05/10 存货编码 尺寸 数量 交期 0 K10Y0190000X B140 200 2019-05-10 00:00:00 1 K10Y01 ...

  7. python 替换array中的值_利用Python提取视频中的字幕(文字识别)

    我的CSDN博客id:qq_39783601,昵称是糖潮丽子~辣丽 从今天开始我会陆续将数据分析师相关的知识点分享在这里,包括Python.机器学习.数据库等等. 今天来分享一个Python小项目! ...

  8. python对excel数据更改_利用python对excel中一列的时间数据更改格式代码示例

    本篇文章小编给大家分享一下利用python对excel中一列的时间数据更改格式代码示例,文章代码介绍的很详细,小编觉得挺不错的,现在分享给大家供大家参考,有需要的小伙伴们可以来看看. 问题场景:需要将 ...

  9. python把汉字变成拼音英文_利用python将表格中的汉字转化为拼音

    GB18030的字符集标准 http://zbgb5.com/2/StandardDetail479488.htm 缺少包时用pip install 进行安装,例如: pip install xlsx ...

最新文章

  1. 另一个git进程似乎在这个存储库中运行
  2. spring aop代码的增强
  3. C语言中比较大小的函数模板,C语言中实现模板函数小结 : 不敢流泪
  4. Spring Batch中的块处理
  5. python网络爬虫爬取视频_Python网络爬虫——爬取小视频网站源视频!自己偷偷看哦!...
  6. 二进制,八进制十进制十六进制之间数据转换
  7. 小程序或者APP 自行使用TOKEN 实现登录会话保持
  8. 『伪原创工具 』英文在线伪原创工具
  9. Python转义符的使用
  10. 保险私有云 IaaS 资源池选型与演进之路 | SmartX 客户实践
  11. Mybatis逆向工程同名表找错数据库的问题
  12. 理解C#中装箱和拆箱的概念
  13. 把Excel转换成xml文件
  14. Unity脚本(四)
  15. 最好用的地图匹配框架——基于HMM的Valhalla
  16. 显示你个性的鼠标指针(转)
  17. Red Hat Enterprise Linux 8(简称RHEL 8,中文名红帽企业Linux 8)的分享链接
  18. Android 极光推送SDK集成
  19. ArcGIS Pro基本操作教程(三)
  20. 什么是网络安全,以及网络安全的特征

热门文章

  1. 像素、灰度、RGB、分辨率
  2. RGB——三原色到五颜六色
  3. 【高数】两类曲线积分的联系
  4. linux cp 全覆盖,Linux中使用cp命令进行强制覆盖的方法
  5. 国内比较有实力的调查研究咨询公司
  6. 计算机应用决策支持系统,决策支持系统
  7. firebird嵌入式数据库
  8. 论语 阳货篇(笔记)
  9. 小学 计算机阅卷,小学生考试也使用网上阅卷了,公平吗?
  10. 聚焦 Android 11 : 隐私和安全