知乎上有人提问:用python进行办公自动化都需要学习什么知识呢?

这可能是很多非IT职场人士面临的困惑,想把python用到工作中,却不知如何下手?python在自动化办公领域越来越受欢迎,批量处理简直是加班族的福音。

自动化办公无非是excel、ppt、word、邮件、文件处理、数据分析处理、爬虫这些,这次就来理一理python自动化办公的那些知识点。python基础

excel自动化

ppt自动化

word自动化

邮件处理

文件批量处理

数据处理与分析

自动化爬虫

下面一一详解。

python基础

能做这些的前提是会使用Python,最起码要熟悉基本语法,可以编写小脚本。

对于python语法的要求,你可以对照python基础教程的部分查看需要学那些,找个免费视频教程跟着学,然后多敲代码练习。如果习惯看书的话,可以买本python入门书备查。

语法主要内容基本数据类型不可变数据(3 个):Number(数字)、String(字符串)、Tuple(元组)可变数据(3 个):List(列表)、Dictionary(字典)、Set(集合)

运算符算术运算符、逻辑运算符、赋值运算符、比较运算符、位运算符...

数值类型整型(Int)、浮点型(float)、复数(complex)

条件控制语句if...elif...else语句

循环语句while语句、for语句

函数def定义函数、函数调用、参数传递、匿名函数...

迭代迭代过程、迭代器、生成器、生成器表达式

文件操作open()函数、read、readline、readlines、write...方法

os模块处理系统文件和目录

模块模块导入、常用标准模块、常用第三方库

错误和异常try/except语句

面向对象简单掌握面向对象概念即可

关于python的基础语法,可以参考我们的入门教程:

python666.cn

语法是关键,一定要理解python编程的基本概念,再去学其他的工具库。

不然会很痛苦的。

excel自动化

office家族其实都可以用VBA解决自动化的问题,但可能很多人不会用。

python针对excel有很多的第三方库可以用,比如xlwings、xlsxwriter、xlrd、xlwt、pandas、xlsxwriter、win32com、xlutils等等。

这些库可以很方便地实现对excel文件的增删改写、格式修改等,当然并不推荐你全部都去尝试一下,这样时间成本太大了。使用xlwings和pandas这两个就够了,基本能解决excel自动化的所有问题。

xlwings不光可以读写excel,还能进行格式调整、VBA操作,非常强大且易于使用。官网教程:

https://www.xlwings.org/

pandas是大家都熟悉的数据处理利器,它也支持excel的读写,接口友好。这个后面会讲到。

对比Excel,轻松学习Python数据分析(博文视点出品)

作者:张俊红

京东

ppt自动化

python当然是支持ppt的自动化处理,主要的库有pywin32com、pptx,可以创建、修改ppt文件。

推荐使用pptx库,目前主流的ppt处理库。

学习网站:

https://python-pptx.readthedocs.io/en/latest/

word自动化

python操作Word的库:python-docx、import docx:只对windows平台有效

pypiwin32、import win32com:跨平台,但无法处理doc格式的word文本,doc格式不是基于xml的

textract、import textract:它同时兼顾"doc”和"docx”,但安装过程需要一些依赖。你可以批量的用python生成word文件,推荐使用docx,不需要会太多。

学习网站:

https://python-docx.readthedocs.io/en/latest/

邮件处理

python处理邮件也是极其便利的,smtplib、imaplib、email三个库配合使用,实现邮件编写、发送、接收、读取等一系列自动化操作,省时省力。

发邮件的坑在于邮箱服务器的选择和设置,而这个又会随着邮箱服务商的更新而变动,所以实际使用时还需要多搜索相关文档和教程。

文件批量处理

文件处理包括批量修改或创建文件名、批量生成文档、批量修改路径等等重复性操作。如果一个个手工操作,那真的心累。

python在处理批量操作有得天独厚的优势,成千上万的文件修改可能只需几秒的时间。

os是python文件操作的库,可以实现对电脑上文件的增删改查。

方法作用os.chdir(path)改变当前工作目录

os.getcwd()返回当前工作目录

os.listdir()返回path指定的文件夹包含的文件或文件夹的名字的列表

os.makedirs(path[, mode])创建一个名为path的文件夹

os.remove(path)删除路径为path的文件

......

数据处理和分析

我就是做数据分析工作的,基本也是python作为主要工具,所以这一块毋庸置疑是python自动化办公最有价值的部分。

数据处理的库主要有:pandas、numpy、matplotlib、sklearn...

pandas是一款不断进步的python数据科学库,它的数据结构十分适合做数据处理,并且pandas纳入了大量分析函数方法,以及常用统计学模型、可视化处理。

如果你使用python做数据分析,在数据预处理的过程,几乎九成的工作需要使用pandas完成。

在一些企业招分析师的笔试题中,pandas已经作为必考的工具,所以如果你想要入行数据分析师,请努力学习使用pandas。

numpy是python的数值计算库,包括pandas之类的很多分析库都建立在numpy基础上。

numpy的核心功能包括:ndarray,一个具有矢量算术运算和复杂广播能力的快速且节省空间的多维数组

用于对整组数据进行快速运算的标准数学函数(无需编写循环)

用于读写磁盘数据的工具以及用于操作内存映射文件的工具

线性代数、随机数生成以及傅里叶变换功能

用于集成由C、C++、Fortran等语言编写的代码的A C API

numpy之于数值计算特别重要是因为它可以高效处理大数组的数据。这是因为:比起Python的内置序列,numpy数组使用的内存更少

numpy可以在整个数组上执行复杂的计算,而不需要Python的for循环

matplotlib和seaborn是python主要的可视化工具,建议大家都去学学,数据的展现和数据分析同样重要。

sklearn和keras,sklearn是python机器学库,涵盖了大部分机器学习模型。keras是深度学习库,它包含高效的数值库Theano和TensorFlow。

python自动化办公模块有哪些-Python自动化办公知识点整理汇总相关推荐

  1. python自动化办公模块有哪些-Python 自动化办公|Word文档

    [Python 自动化办公]专栏是介绍如何利用python办公,减少工作负荷.篇幅精炼,内容易懂,无论是否有编程基础,都非常适合. 在上次文章中,我们学习了[用python写入excel],这次我们学 ...

  2. 关于python中requests模块导入问题-python中requests模块的使用方法

    本文实例讲述了python中requests模块的使用方法.分享给大家供大家参考.具体分析如下: 在HTTP相关处理中使用python是不必要的麻烦,这包括urllib2模块以巨大的复杂性代价获取综合 ...

  3. python ssh登陆模块_使用python的Paramiko模块登陆SSH

    paramiko是用Python语言写的一个模块,遵循SSH2协议,支持以加密和认证的方式,进行远程服务器的连接. python的paramiko模块可以方便的实现ssh登录,并执行命令. 1. pa ...

  4. python安装pygame模块_windows下 python 如何安装pygame模块

    本机系统:win7,Pyhon版本: 3.6.0 1. 安装下载python 官网 https://www.python.org/ 下载地址 https://www.python.org/downlo ...

  5. python导入自定义模块_ubuntu下Python导入自定义模块的方法

    ubuntu下Python导入自定义模块的方法 当在python程序中导入自定义模块时,若出现"Import Error:no module named xxx"表明系统在pyth ...

  6. python中tkinter模块_使用Python中的tkinter模块作图的方法

    python简述: Python是一种解释型.面向对象.动态数据类型的高级程序设计语言.自从20世纪90年代初Python语言诞生至今,它逐渐被广泛应用于处理系统管理任务和Web编程.Python[1 ...

  7. python链接hbase模块_利用python访问Hbase(Thrift模块安装与测试)

    转:http://shineforever.blog.51cto.com/1429204/1567640/ hadoop环境介绍: master服务:node1 slave服务器:node2,node ...

  8. python安装docx模块_安装Python的docx模块

    安装Python的docx模块 在执行进行自动化测试的时候,很多时候我们其实不会一直关注这个测试的,很多时候我们只需要关注一个结果,与我们的预期是否相互符合就可以了. 所以我们只需要把预期结果,和实际 ...

  9. python模拟浏览器模块_在Python中使用mechanize模块模拟浏览器功能

    知道如何快速在命令行或者python脚本中实例化一个浏览器通常是非常有用的. 每次我需要做任何关于web的自动任务时,我都使用这段python代码去模拟一个浏览器. import mechanize ...

最新文章

  1. 《Arduino开发实战指南:机器人卷》一3.3 直流电机驱动电路原理
  2. 一个星期+4轮面试终拿下offer,极致干货
  3. 博客统计:腾讯分析这些数据哪儿来的?
  4. 【Java代码】京东商品全部分类数据获取(建表语句+Jar包依赖+树结构封装+爬虫源代码)包含csv和sql格式数据下载可用
  5. JavaScript面向对象——理解构造函数继承(类继承)
  6. 西河某人_如何使用增强现实祝某人生日快乐
  7. 【转载】大规模网站架构实战之体系结构
  8. linux 网络对讲,基于ARM与Linux的全数字化可视对讲系统的设计与实现
  9. linux 建立用户kde目录,安装KDE Plasma后,你要做的七件事
  10. 01.学习笔记-linux操作系统常用命令
  11. 2、使用Keras构建回归模型
  12. VS Code、IDEA开发工具及插件
  13. oracle价格的数据类型,oracle数据库中的number类型
  14. C语言 之 if 语句
  15. 正则表达式Regex
  16. Odroid XU4学习笔记
  17. git 暂存的代码命令
  18. 从ICML 2022看域泛化(Domain Generalization)最新进展
  19. scala函数式变程,curry,读取文件,字符串插值,隐式转换,模式匹配
  20. MyBatis实战【上】

热门文章

  1. 泛微oa系统什么框架_泛微移动办公OA系统走进江苏国曜信息科技有限公司
  2. Java基础(简述拆箱装箱)
  3. Linux 用户操作
  4. python json.dumps() 中文乱码问题
  5. 资料管理工具VSGoogle?
  6. 2018-2019 ACM-ICPC, Asia East Continent Finals题解
  7. JSK-243 三角形的路径权【动态规划】
  8. Vijos P2010 回文日期【回文+日期计算】
  9. CCF NOI1053 相似度
  10. Java 工程与 Eclipse 高级用法