这可能是很多非IT职场人士面临的困惑,想把python用到工作中,却不知如何下手?python在自动化办公领域越来越受欢迎,批量处理简直是加班族的福音。

自动化办公无非是excel、ppt、word、邮件、文件处理、数据分析处理、爬虫这些,这次就来理一理python自动化办公的那些知识点。

python基础

能做这些的前提是会使用Python,最起码要熟悉基本语法,可以编写小脚本。

对于python语法的要求,你可以对照python基础教程的部分查看需要学那些,找个免费视频教程跟着学,然后多敲代码练习。如果习惯看书的话,可以买本python入门书备查。基本数据类型不可变数据(3 个):Number(数字)、String(字符串)、Tuple(元组)

可变数据(3 个):List(列表)、Dictionary(字典)、Set(集合)

运算符算术运算符、逻辑运算符、赋值运算符、比较运算符、位运算符...

数值类型整型(Int)、浮点型(float)、复数(complex)

条件控制语句if...elif...else语句

循环语句while语句、for语句

函数def定义函数、函数调用、参数传递、匿名函数...

迭代迭代过程、迭代器、生成器、生成器表达式

文件操作open()函数、read、readline、readlines、write...方法

os模块处理系统文件和目录

模块模块导入、常用标准模块、常用第三方库

错误和异常try/except语句

面向对象简单掌握面向对象概念即可

excel自动化

office家族其实都可以用VBA解决自动化的问题,但可能很多人不会用。

python针对excel有很多的第三方库可以用,比如xlwings、xlsxwriter、xlrd、xlwt、pandas、xlsxwriter、win32com、xlutils等等。

这些库可以很方便地实现对excel文件的增删改写、格式修改等,当然并不推荐你全部都去尝试一下,这样时间成本太大了。使用xlwings和pandas这两个就够了,基本能解决excel自动化的所有问题。

xlwing不光可以读写excel,还能进行格式调整、VBA操作,非常强大且易于使用。

ppt自动化

python当然是支持ppt的自动化处理,主要的库有pywin32com、pptx,可以创建、修改ppt文件。

推荐使用pptx库,目前主流的ppt处理库。

word自动化

python操作Word的库:python-docx、import docx:只对windows平台有效

pypiwin32、import win32com:跨平台,但无法处理doc格式的word文本,doc格式不是基于xml的

textract、import textract:它同时兼顾“doc”和“docx”,但安装过程需要一些依赖。你可以批量的用python生成word文件,推荐使用docx,不需要会太多。

邮件处理

python处理邮件也是极其便利的,smtplib、imaplib、email三个库配合使用,实现邮件编写、发送、接收、读取等一系列自动化操作,省时省力。

文件批量处理

文件处理包括批量修改或创建文件名、批量生成文档、批量修改路径等等重复性操作。如果一个个手工操作,那真的心累。

python在处理批量操作有得天独厚的优势,成千上万的文件修改可能只需几秒的时间。

os是python文件操作的库,可以实现对电脑上文件的增删改查。os.chdir(path)改变当前工作目录

os.getcwd()返回当前工作目录

os.listdir()返回path指定的文件夹包含的文件或文件夹的名字的列表

os.makedirs(path[, mode])创建一个名为path的文件夹

os.remove(path)删除路径为path的文件

数据处理和分析

我就是做数据分析工作的,基本也是python作为主要工具,所以这一块毋庸置疑是python自动化办公最有价值的部分。

数据处理的库主要有:pandas、numpy、matplotlib、sklearn...

pandas是一款不断进步的python数据科学库,它的数据结构十分适合做数据处理,并且pandas纳入了大量分析函数方法,以及常用统计学模型、可视化处理。

如果你使用python做数据分析,在数据预处理的过程,几乎九成的工作需要使用pandas完成。

在一些企业招分析师的笔试题中,pandas已经作为必考的工具,所以如果你想要入行数据分析师,请努力学习使用pandas。

numpy是python的数值计算库,包括pandas之类的很多分析库都建立在numpy基础上。

numpy的核心功能包括:ndarray,一个具有矢量算术运算和复杂广播能力的快速且节省空间的多维数组

用于对整组数据进行快速运算的标准数学函数(无需编写循环)

用于读写磁盘数据的工具以及用于操作内存映射文件的工具

线性代数、随机数生成以及傅里叶变换功能

用于集成由C、C++、Fortran等语言编写的代码的A C API

numpy之于数值计算特别重要是因为它可以高效处理大数组的数据。这是因为:比起Python的内置序列,numpy数组使用的内存更少

numpy可以在整个数组上执行复杂的计算,而不需要Python的for循环

matplotlib和seaborn是python主要的可视化工具,建议大家都去学学,数据的展现和数据分析同样重要。

sklearn和keras,sklearn是python机器学库,涵盖了大部分机器学习模型。keras是深度学习库,它包含高效的数值库Theano和TensorFlow。

这些是大家耳熟能详的神库,非常推荐去学习。

自动化爬虫

相信爬虫是大家最感兴趣的,python爬虫有很多的实现库,比如:urllib、requests、scrapy等,以及xpath、beautifulsoup等解析库。

爬虫入门容易,但学精难,所以初学者可以尝试写点简单的爬虫,比如豆瓣、知乎、微博呀。

其它

其它不常用的自动化办公库,像处理pdf、图片、视音频等,这里不做过多介绍。

python批量处理 办公_你们都用Python实现了哪些办公自动化?相关推荐

  1. python国内书籍推荐_这些都是Python官方推荐的最好的书籍

    转行学Python有前途吗?这个答案是肯定的,AI课程都已经进入小学教材了,未来Python趋势无疑是光明的,但是如何学习Python,很多Python小白都来问小编有什么适合的Python入门书籍推 ...

  2. python批量检索文献_自从用了Python,轻松查文献,释放80%的重复劳动时间!

    一入科研深似海,每逢开题倍忧桑.被 paper 和发际线上移支配的恐惧要回来了--一个假发片还够用吗?1文献看到眼花科研热点总是无缘 加了几十个实验组微信群. QQ 群,想追踪前沿文献,了解跟自己课题 ...

  3. python批量生成图表_教你用Python自动读取数据生成图表,产生的效益很可观

    厌烦了每次都要在Excel里拖动数据来生成图形吧,这篇文章里,教你用Python自动读取Excel数据生成图表,然后Python 使用XlsxWriter模块在Excel工作表中绘制带有数据表的柱形图 ...

  4. Python实现自动化办公(三):Python对PPT文档的基本操作(python-pptx)

    Python对PPT文档的基本操作 文章目录 Python对PPT文档的基本操作 一.pptx模块 1.官方文档 2.安装pptx模块 二.基本函数的使用方法 三.使用案例 1.修改ppt内容 2.写 ...

  5. python 书籍 办公 自动化_你们都用Python实现了哪些办公自动化?

    这可能是很多非IT职场人士面临的困惑,想把python用到工作中,却不知如何下手?python在自动化办公领域越来越受欢迎,批量处理简直是加班族的福音. 自动化办公无非是excel.ppt.word. ...

  6. python 批量创建线程_【Python】批量创建线程

    在<[Python]线程的创建.执行.互斥.同步.销毁>(点击打开链接)中介绍了Python中线程的使用,但是里面线程的创建,使用了很原始的方式,一行代码创建一条.其实,Python里是可 ...

  7. python pdf删除图片_【原创】python批量删除pdf图片水印(Xobject)的一种方法

    1.说明: 下载到的pdf总会有一些水印,pdf文件水印添加方式除了acrobat adobe自带的以外,还有很多,所以去除水印方法也很多,这里介绍的也只是一种适用python批量删除图片水印Xobj ...

  8. python批量打印网页_用Python批量打印定制的HTML页面

    让我提供一些背景知识. 我自愿参加的一个组织为那些在假期不能来取餐的人送饭. 他们目前有一个sqlserverdb,该数据库存储所有客户机的信息以及每年的用餐信息. 目前,一个Java桌面应用程序连接 ...

  9. python批量生成图_利用Python批量生成任意尺寸的图片

    实现效果 通过源图片,在当前工作目录的/img目录下生成1000张,分别从1*1到1000*1000像素的图片. 效果如下: 目录结构 实现示例 # -*- coding: utf-8 -*- imp ...

最新文章

  1. 对输入框以及选择框集体的数据检验
  2. 《中国式方案秘籍(上部)》
  3. Windows客户端C/C++编程规范“建议”——函数调用
  4. 2022新冠两大毒王合体?印媒炒作高危变异毒株缝合怪「Delmicron」
  5. Leetcode:114. Flatten Binary Tree to Linked List
  6. mac mongodb可视化工具_「时序数据库」和MongoDB:第3部分-查询、分析和呈现
  7. 神策数据张何津:构建银行数字化运营体系,赋能业态新发展
  8. android开发 Gradle多渠道打包以及集成360加固
  9. 如何通过DBLINK取REMOTE DB的DDL
  10. mac 删除分区 command r 选择网络_Mac使用必看基础篇,Mac快捷键大全,mac新手入门指南...
  11. Haxe东游记(上)part1.5:roadmap
  12. Lua语言学习-错误处理和调试
  13. 计算机网络工程税率多少,弱电工程增值税6%、9%、13%税率怎样选择?
  14. 试比较瀑布模型、快速原型模型、增量模型和螺旋模型的优缺点
  15. EyouCMS瀑布流分页详细教程
  16. 笔记本电脑频繁自动重启_笔记本电脑频繁自动重启的原因和纠正
  17. 数字排列问题(全排例)
  18. C++多线程同步效率对比之临界区和原子锁
  19. 卡西欧科学计算机使用方法,卡西欧计算器使用说明
  20. 358. K 距离间隔重排字符串 排序

热门文章

  1. 我新买的计算机为什么是英语,新买的电脑蓝屏一直显示英文处理方法大全
  2. Spark开源REST服务——Apache Livy(Spark 客户端)
  3. 10款超好用的Python开发工具
  4. 【数据库系统】数据库系统概论====第六章 关系数据库理论
  5. springcloud 配置中心 SSH 密钥验证
  6. 分享本周所学——使用Flask实现Python程序服务化
  7. 人生若只如初见,何事秋风悲画扇。—第三二十天
  8. navicat12看不到postgre数据库里的表
  9. 【⑩MySQL】:表管理,让数据管理不再困难
  10. 树莓派zero w ssh远程登录配置好各种文件后连接电脑没有反应