文章目录

  • 1 文本清洗函数
  • 2 关联匹配类
    • 2.1 LOOKUP和VLOOKUP
    • 2.2 INDEX和MATCH
    • 2.3 ROW和COLUMN
    • 2.4 OFFSET
    • 2.5 HYPERLINK
  • 3 逻辑运算类
  • 4 计算统计类
  • 5 时间序列类
  • 6 Excel的常见技巧
  • 7 用Excel进行数据分析

数分工具的应用:

小白学习顺序

Excel 学习要点:

  • Excel保证新版本(2013+)
  • 培养好的数据表格习惯
  • 主动性搜索
  • 多练习

函数:

1 文本清洗函数

字符串:





拼接函数:concatenate(text,text)


将text中的old_text转换为new_text。

将值转换为时间格式


删除字符串前后多余的空格。

len() 计算字符串的长度。

2 关联匹配类

2.1 LOOKUP和VLOOKUP


=VLOOKUP(查找值,查找区域,返回查找区域第N列,查找模式)
搜索表区域首列满足条件的元素,确定待检索单元格在区域中的行序号,再进一步返回选定单元格的值。默认情况下,表是以升序排序的

2.2 INDEX和MATCH

INDEX:在给定的单元格区域中,返回特定行列交叉处单元格的值或引用

MATCH:返回符合特定值特定顺序的项在数组中的相对位置

组合:返回选定值在表格中对应的另一个值
INDEX(表格,MATCH(值,表格,0),另一个值)

2.3 ROW和COLUMN

ROW():返回一个引用的行号
COLUMN():返回一个引用的列号

2.4 OFFSET



以1所在的S2为参考,偏移一行一列,大小为一个单元格,所以结果为4。负数也可以,向上向左偏移。

2.5 HYPERLINK

HYPERLINK:超链接,创建一个快捷方式或链接,以便打开一个存储在硬盘、网络服务器或Internet上的文档

3 逻辑运算类



if:判断是否满足某个条件,如果满足返回一个值,如果不满足则返回另一个值。

is可以用来查找是否是数字或者逻辑值等等,用来数据清洗。

4 计算统计类

  • sum:求和
  • sumproduct:两列先相乘,结果求和。
  • count:计数,为空的不计算在内
  • max/min/average:某个区域内的最大值/最小值/平均值
  • rank:返回某数字在一列数字中相对于其他数值的大小排名;如果多个数值排名相同,则返回平均值排名
  • rand:返回大于或等于0且小于1的平均分布随机数(依重新计算而变)
  • randbetween:返回一个介于指定的数字之间的随机数

    quatile:基于从0到1之间(不含0与1)的百分点值,返回一组数据的四分位点,即统计所选数据的几分位点数。

  • stdev:计算基于给定的样本总体的标准偏差(忽略逻辑值及文本)
    subtotal:返回一个数据列表或数据库的分类汇总
  • int:将数值向下取整为最接近的整数
  • round:按指定的位数对数值进行四舍五入
  • countifs:统计—组给定条件所指定的单元格数

5 时间序列类

Year:返回日期的年份值,一个1900-9999之间的数字。

Month:返回月份值,是一个1(一月)到12(十二月)之间的数字。

Day:返回一个月中的第几天的数值,介于1到31之间。

Weekday:返回代表一周中的第几天的数值,是一个1到7之间的整数。

weeknum:返回—年中的周数

Now:返回日期时间格式的当前日期和时间。

Today:返回日期格式的的当前日期。

Date:返回在Microsoft Excel日期时间代码中代表日期的数字,将分开的年月日组合起来

Days:返回两个日期之间的天数。

6 Excel的常见技巧

快捷键:

定义名称:将一列数据定义为一个名称,通过调用这个名称就可以对整列进行操作
avg(avg)就是对整列求均值

数据→\rightarrow→删除重复值→\rightarrow→就可以知道某一列非重复的值有多少,也就是分类

数据→\rightarrow→数据验证→\rightarrow→验证条件选择序列,就可以实现在下拉菜单中选择

迷你图:点击需要插入表格的单元格,插入→\rightarrow→折线图

7 用Excel进行数据分析

  1. 点评数最高的饭店
    直接对点评数进行排序
    或者使用max()找到最大值,使用match(max(),区域,0)找到最大值所在位置,然后用index(区域,match(max(),区域,0),1)找到匹配的店铺名。


2. 哪个城市人均口味最好
建立数据透视表,口味设为均值 ,然后对均值进行排序

排序后的结果:

  1. 哪个类型的餐饮评价最好

  2. 类型为川菜的店中,有多少个带「辣」字,又有多少个带「麻」字?

    筛选带‘麻’、‘辣’的字段,然后加入筛选器,空值不选,类型选择 川菜,最后看下面的计数。




    减去首行的一行,最终结果减1。

  3. 口味、环境、服务,三个评价都在8.0以上的饭店有几家?它们在哪个城市的占比最多?
    在筛选器里选择→\rightarrow→数字筛选→\rightarrow→大于

    三个都筛选完,查看计数

    然后使用数据透视表,查看城市的计数

    排序

  4. 上海地区中,各个类型饭店服务前五名?
    使用筛选器,首先选择城市为上海,然后对类型和服务进行排序

    使用if语句设置每个类型的店铺有几家


    再使用筛选器,选择数量大于5的店铺

  5. 没有评价的饭店有几家?
    使用count()函数,count函数不计算空值,然后总数减去count()的值。

  6. 将人均价格划分成0-50 ,50-100,100-150,150- 200,200+这几个档次,各个城市分别有几家?其中占比又是多少?
    将人均除以50再向上取整,然后使用数据透视表

  7. 将点评、人均、口味、环境、服务这几个指标加工出一个综合评价系数,并且计算哪十家店是最好的(开放题).
    对口味、环境、服务加权求均值,人均求LOG(),评分求LOG来削弱影响,然后对三个结果进行加权,最后归一化排名,取分数最高的十家。

参考链接:【秦路】七周成为数据分析师《第三周:Excel》

(秦路)七周成为数据分析师(第三周)—— Excel相关推荐

  1. (秦路)七周成为数据分析师(第一周)—— 数据分析思维

    文章目录 1. 什么是数据分析 2.应该怎么学 3. 数据分析思维 3.1 三种核心思维 3.1.1 结构化 3.1.2 公式化 3.1.3 业务化 3.2 数据分析的思维技巧 3.3 数据分析思维九 ...

  2. (秦路)七周成为数据分析师(第二周)—— 业务能力

    文章目录 1.为什么业务思维重要 2.经典的业务分析指标 2.1 市场营销指标 2.1.1 生命周期 2.1.2 用户价值 2.1.3 RFM模型 2.2 产品运营指标 2.2.1 AARRR模型 2 ...

  3. [学习笔记]B站视频:磨剑之作,七周成“师”!【七周成为数据分析师】- 第一周

    [学习笔记]B站学习视频:七周成为数据分析师-第一周 序 数据思维 结构化 公式化 业务化 数据分析的思维技巧 象限法 多维法 假设法 指数法 二八法 对比法 漏斗法 如何在业务时间锻炼数据分析思维 ...

  4. 七周成为数据分析师 第二周:业务篇-框架与模型

    七周成为数据分析师 第七周:Python - CSDN博客 七周成为数据分析师 第六周:统计学 - CSDN博客 七周成为数据分析师 第五周:Mysql - CSDN博客 七周成为数据分析师 第四周: ...

  5. 七周成为数据分析师 第二周:业务篇-指标

    七周成为数据分析师 第七周:Python - CSDN博客 七周成为数据分析师 第六周:统计学 - CSDN博客 七周成为数据分析师 第五周:Mysql - CSDN博客 七周成为数据分析师 第四周: ...

  6. (秦路)七周成为数据分析师(第七周)——Python

    文章目录 1.Python基础 2.Pandas 2.1 series 生成 用索引读取相应的行 2.2 DataFrame 生成 查看形状 查看属性和信息 查看数据类型 查看某列有多少种元素 查看某 ...

  7. 天善磨剑之作,七周成为数据分析师秦路主讲

    章节1: 如何七周成为数据分析师   课时1:为什么需要七周   课时2:七周应该怎么学 章节2: 第一周:数据分析思维   课时3:为什么思维重要   课时4:数据分析的三种核心思维(结构化)    ...

  8. 如何成为python 数据分析师_如何七周成为数据分析师20:了解和掌握Python的函数...

    本文是<如何七周成为数据分析师>的第二十教程,如果想要了解写作初衷,可以先行阅读七周指南.温馨提示:如果您已经熟悉Python,大可不必再看这篇文章,或只挑选部分. Python之所以灵活 ...

  9. python数据分析要学多久_如何七周成为数据分析师18:Python的新手教程

    本文是<如何七周成为数据分析师>的第十八篇教程,如果想要了解写作初衷,可以先行阅读七周指南.温馨提示:如果您已经熟悉Python,大可不必再看这篇文章,或只挑选部分. Python是近年来 ...

最新文章

  1. asp.net发布到IIS中出现错误:处理程序“PageHandlerFactory-Integrated”在其模块列表中有一个错误模块“ManagedPipelineHandler”...
  2. Java工程师学习步骤
  3. 最有用的Postgres扩展:pg_stat_statements
  4. Struts2标签库常用标签
  5. SpringBoot中AOP实现落地——Filter(过滤器)、Intercepter(拦截器)、Aspect(Spring AOP)
  6. html工具箱源码,大灰狼的ASP工具箱——XMLHTTP的应用,获得远程的文件,获得远程HTML文件源码...
  7. DM8达梦数据库:sql查询达梦数据库实例的详情
  8. 【读书】2022年阅读记录
  9. 不能随便给他人登录微信小程序
  10. Footprint Analytics: 从多个维度带你进入 GameFi 领域
  11. Win10系统下安装CAD2006与CASS
  12. easyar no matched package name
  13. python爬虫二:网易博客的图片
  14. python刷新cdn_使用Python解析阿里云CDN日志
  15. Python E化-英文资料自动翻译
  16. 服务器定时执行js脚本
  17. 用Python对CAPM和Fama French Three Factor model的初步学习
  18. KindEditor使用简介
  19. c语言食堂消费管理系统,食堂消费管理系统_食堂财务管理系统v1.0单机版
  20. .NET 跨平台界面框架和为什么你首先要考虑再三

热门文章

  1. DNF怎么查看服务器状态,《DNF》如何判断自己网络还是服务器出问题
  2. 【yum和dnf报错:ModuleNotFoundError: No module named ‘dnf‘】
  3. 把机械姬放在清宫,她能活到第几集?
  4. A Tale from the Dark Side of The Moon
  5. appserv怎么安装mysql_AppServ怎么安装?AppServ 8.6.0 64位图文超详细安装教程(附下载)...
  6. saltstack pillar
  7. 现在W ndows哪个版本好,(WndowsXP安全知识.doc
  8. 傅里叶变换和小波变换分析
  9. 元宇宙旅游局 | 赛博卢浮与法老王的金字塔
  10. EA使用小技巧-定制类图的显示方式