Excel和Python,作为数据分析的主流工具,在从效率提升到数据商业化的整个过程中,都起到了重要作用。不管是在Excel中通过鼠标点选实现,亦或是利用Python通过代码实现,数据分析中的很多基础功能都是相通的。

在数据量级大跃进的今天,对于从业者来说,熟练掌握用于数据处理的编程语言非常必要,通晓两者可以更增竞争力。而借助大家最为熟悉的Excel操作,对照学习相应的Python实现,可以帮助更快理解,轻松掌握。

都说Excel关键要掌握4个核心函数(vlookup,if,sum,sumif)和1个核心功能(数据透视表),本期我们就聚焦在广受喜欢的数据透视表和VLOOKUP的操作。

数据透视表

使用数据透视表,可以快速汇总数据,进而进行进一步的分析。

例如,对于一张简单的家庭开支列表,可以基于该列表制作数据透视表

1.Excel实现

使用数据透视表,在“插入”——“数据透视表”,选中需要创建数据透视表的数据。

我们可以看到如下界面:上半部分为数据透视表中的所有字段,下半部分为数据透视表的选项,把上方的字段拖入下方对应框中即可完成数据透视表。

这里使用2018年国内上市公司管理层报酬统计数据为例,以“公司行业”为行标签,“公司组织形式”为列标签,对“年度报酬总额(万元)”数据计算平均数,得到如下分类汇总和聚合计算。

2.Python实现

Python中数据透视表的实现原理与Excel类同,使用pandas库中的pivot_table()方法。data:要进行数据透视表操作的DataFrame对象

values:要进行值计算的列,对应Excel操作中“数值”框

index:行索引,对应Excel操作中“行标签”框

columns:列名,对应Excel操作中“列标签”框

aggfunc:设定对values要进行的计算类型

fill_value:对空值的填充值

margins:是否显示合计列

dropna:是否删除缺失值

margins_name:设置合计列的列名

当然,我们可以进行更多灵活操作,如对各类别的“前三名高管报酬总额”求中位数,对“年度报酬总额”求均值,这种对不同的值进行不同类型计算,可以通过aggfunc传入字典(键为列名,值为计算方式)来设定。

VLOOKUP

实际工作中,我们经常会需要用到查找功能,VLOOKUP很多时候是Excel用户学习的第一个查找函数,也是Excel最常使用的三个函数之一,被称为Excel中的效率之王。它应用非常广泛,比如可以将多表匹配、合并,达到对比、查漏等效果,甚至前段时间新诞生的xlookup也借着它的大名火了一把。

例如,在如下信息表中,我们可以查找到与ID号102完全匹配的姓氏,进行返回。

1.Excel实现

VLOOKUP这个名称中,v为vertical竖直的意思,lookup即为查找,它实现的是纵向按列查找,返回该列所需查询序列所对应的值。

函数表示:

即:VLOOKUP(你想要查找的内容, 要查找的范围, 包含要返回的值的区域中的列号, 返回近似或精确匹配)

这里我们继续使用2018年国内上市公司管理层报酬统计数据,需要查找指定的10家上市公司名称、年度报酬总额、前三名董事报酬总额,及前三名高管报酬总额。在Excel中,就可使用VLOOKUP函数实现,如L2的名称数据,是以J2为要进行查找的关键字,查找范围为A2:H3594,返回列数为2(表示查找范围的第2列,即“名称”),匹配模式为FALSE(表示精确匹配)而得到。

2.Python实现

Python中有多种方法可以实现该操作,推荐使用pandas库中的merge()函数,它是全功能、高性能的连接操作,在习惯上非常类似于SQL等关系数据库。left:参与合并的左侧DataFrame

right:参与合并的右侧DataFrame

how:合并方式,为inner,outer,left,right其中之一

on:用于连接的列名,必须存在于左右两侧数据

left_on:左侧DataFrame中用作连接键的列

right_on:右侧DataFrame中用作连接键的列

left_index:将左侧的行索引用作其连接键

right_index:将右侧的行索引用作其连接键

sort:根据连接键对合并后的数据进行排序

通过how进行设置的合并方法,主要取决于merge操作的目的:

若只需要查找到指定的10家上市公司数据,则可采用左连接,以放在左侧的avgs数据为基准;

若主要想对右侧salary数据中的3593家上市公司管理层报酬数据进行分析,仅是将已有的员工人均薪酬数据加入,则可考虑使用右连接;

若想保留同时出现在左右两侧的数据,则可考虑使用内连接,取键的交集;

若想将左右两侧数据都进行保留,则可考虑使用外连接,取键的并集。

除了使用on指定连接键,我们也可将代码设置为index,通过index作为连接键进行匹配

python相比于excel的优势_对照Excel使用Python进行数据分析,更快掌握相关推荐

  1. python相比于excel的优势_都在讨论Python能否取代Excel,那有没有人想到它

    最近看到一个话题,有人问Python到底能不能取代Excel,但是我觉得抛开使用场景的比较都是耍流氓,Photoshop是否有朝一日取代美图秀秀呢?手机是否有朝一日取代台式机?微信是否有朝一日取代电话 ...

  2. python相比于excel的优势_使用Excel和python来做回归分析

    使用Excel和python来做回归分析 作者:PHPYuan 时间:2018-08-01 03:40:50 聊完方差分析,就不得不说回归分析. 回归分析是一种应用广泛的统计分析方法,在金融,医学等领 ...

  3. python语音转文字源码_【python3】Python十行代码搞定文字转语音

    都是copy的百度SDK文档,简单说说怎么用. 1.没安装Python的参见此文:Python学习笔记系列 1 --安装调试Python开发软件 2.win+r输入cmd打开命令行,输入:pip in ...

  4. java跟python优势_当前Java与Python相比还有哪些优势

    首先,Java语言与Python语言都是非常流行的全场景编程语言,在很多开发场景下,既可以使用Java语言,也可以采用Python语言,比如Web开发.大数据开发等等.随着近几年大数据和人工智能领域的 ...

  5. python相比于excel的优势_Python处理excel的优点

    在我们工作中往往需要处理大量的数据,因此Excel在我们工作中是一个必不可少的工具,不过,近期很多人开始用Python处理数据,那么,大家为什么开始用Python了呢?Python辅助处理excel的 ...

  6. python设置excel套打_用强大的Python处理海量的Excel,工作从未如此简单

    excel 欢迎点击右上角关注小编,除了分享技术文章之外还有很多福利,私信学习资料可以领取包括不限于Python实战演练.面试集锦.学习资料等. 前言 成堆的数据如何导入Excel进行分析? 大量的表 ...

  7. excel 宏编程_在 Excel 中使用 Python 开发宏脚本

    点击上方蓝字,每天一起学 Python,文末领送书福利 文 | varlemon 编辑 | EarlGrey 推荐 | 编程派公众号(ID:codingpy) 之前发文介绍过一个叫GridStudio ...

  8. python调用excel的宏_在 Excel 中使用 Python 开发宏脚本

    文 | varlemon 编辑 | EarlGrey 推荐 | 编程派公众号(ID:codingpy) 之前发文介绍过一个叫GridStudio的神器,可以在网页版应用中将 Python 与表格处理结 ...

  9. python处理excel表格入门_零基础使用Python读写处理Excel表格

    引 由于需要解决大批量Excel处理的事情,与其手工操作还不如写个简单的代码来处理,大致选了一下感觉还是Python最容易操作. 安装库 Python环境 首先当然是配环境,不过选Python的一个重 ...

最新文章

  1. 投资的境界:及时抓住机会或止损才是硬道理
  2. 20145227鄢曼君《网络对抗》逆向及Bof基础
  3. Django视图(一)
  4. php如何编写通信协议,定制通讯协议
  5. Linux内核启动过程和Bootloader(总述)
  6. 教你如何用机翻软件开拓自己的青青草原
  7. informix 计算 日期之差
  8. [91ri]渗透用的Python小脚本
  9. plsql 破解注册码
  10. python创意小作品代码-超全代码详解 Python 制作精美炫酷图表教程
  11. Mac大小写切换需长按capslock键解决办法
  12. 怎么批量将DWG文件转换PDF文件
  13. JS 获取 元素 非行内样式
  14. Stderr: VBoxManage.exe: error: VT-x is not available (VERR_VMX_NO_VMX) VBoxM
  15. kibana服务器性能要求,kibana 性能监控 apm
  16. golang详细知识体系
  17. unity 求出物体所在相机的横截面 解决调整 field Of View后场景物体和UI不匹配
  18. 【附源码】计算机毕业设计SSM芮城县十全十美火锅店点餐系统
  19. 开发者眼中的“道、法、术、器”
  20. MacBook Air M1硬盘写入量查询

热门文章

  1. HTML+CSS+JS实现 ❤️基于Javascript简单计算器特效❤️
  2. python隐藏启动台_如何在Python中启动后台进程?
  3. mybatis不等于某个字符串的值_MyBatis 的 4 个妙用,别再踩坑了!
  4. mysql with as 用法_Python之图解with语句
  5. 计算机信息科学蔺泽浩,上海交通大学计算机科学与工程系(CSE)
  6. android 教程概要,Android精通教程-第一节Android入门简介
  7. 素描java字母_进行Java基本GUI设计需要用到的包是
  8. Python中利用LSTM模型进行时间序列预测分析
  9. 线程池写入mysql_用多线程写入数据库的问题(150分)
  10. 【Python】Windows下Python3虚拟环境搭建