目录索引

  • 一、常见指标和术语
    • 1、百分比与百分点
    • 2、比例与比率
    • 3、倍数与番数:
    • 4、同比与环比:
  • 二、常见理论模型
    • 1、PEST分析:
    • 2、5W2H分析:
    • 3、4P营销理论:
  • 三、数据
    • 1、字段与记录
    • 2、txt文本导入excle中
    • 3、 重复数据处理方法
      • 3.1 函数法
      • 3.2 高级筛选法
      • 3.3 条件格式法
      • 3.4 数据透视表
      • 3.5 重复数据删除
    • 4、 缺失数据处理方法
      • 4.1 批量填充
      • 4.2 查找替换
    • 5、 空格数据处理
      • 5.1 查找替换
      • 5.2 trim函数
    • 6、 数据合并
      • 6.1 concat函数
      • 6.2 连接符“&”
      • 6.3 日期函数
      • 6.4 字段匹配
    • 7、 数据抽取
      • 7.1 字段拆分
        • 7.1.1 菜单法
        • 7.1.2 函数法
      • 7.2 随机抽样
        • 7.2.1 rand()函数
        • 7.2.2 randbetween()函数
    • 8、 数据计算
      • 8.1 datedif(start_date,end_date,unit)函数
      • 8.2 if分组函数
      • 8.2 vlookup函数分组
    • 9、 数据转换
      • 9.1 二维表转一维表
      • 9.2 数据类型转换

一、常见指标和术语

1、百分比与百分点

  • 百分比:一个数是另一个数的半分之几,也叫百分率或百分数,度量单位1%;
  • 百分点:不同时期以百分数的形式表示的相对指标的变动幅度,1个百分点=1%,常用语表示构成的变动幅度,今年比去年提高了17个百分点,今年45%,去年28%。

2、比例与比率

  • 男女比率、男生比例
  • 比例:总体中各部分的数值占全部数值的比重,反映总体的构成和结构;
  • 比率:不同类别数值的对比,不是部分与整体的关系,而是整体中各部分之前的关系。

3、倍数与番数:

  • 倍数:一个数除以另一个数所得的商,A是B 的C倍,即A ÷B=C,倍数常用于数量的增长;
  • 番数:原来数量的2的N次方。翻一番为原来数量的2倍(2^1),翻两番为4倍(2 ^2)。

4、同比与环比:

  • 同比:历史同时期进行比较得到的数值,该指标主要反映的是事务发展的相对情况。2021.12/2009.12就是同比;
  • 环比:与前一个统计期进行比较得到的数值,该指标主要反映的是事物逐期发展的情况。2010.12/2010.11就是环比。

二、常见理论模型

  • 营销方面:4p、用户使用行为、stp理论、swot等;
  • 管理方面:pest、5w2h、时间管理、生命周期、逻辑树、金字塔、smart原则等。

1、PEST分析:

PEST分析是指宏观环境的分析,P是政治(politics),E是经济(economy),S是社会(society),T是技术(technology)。在分析一个企业集团所处的背景的时候,通常是通过这四个因素来分析企业集团所面临的状况。

2、5W2H分析:

(1)WHAT——是什么?目的是什么?做什么工作?
(2)WHY——为什么要做?可不可以不做?有没有替代方案?
(3)WHO——谁?由谁来做?
(4)WHEN——何时?什么时间做?什么时机最适宜?
(5)WHERE——何处?在哪里做?
(6)HOW ——怎么做?如何提高效率?如何实施?方法是什么?
(7)HOW MUCH——多少?做到什么程度?数量如何?质量水平如何?费用产出如何?

3、4P营销理论:

4P营销理论被归结为四个基本策略的组合,即产品 ( Product )、价格( Price )、促销( Promotion)、渠道(Place ),由于这四个词的英文字头都是P,再加上策略(Strategy),所以简称为“4P’s”。
产品(Product)
注重开发的功能,要求产品有独特的卖点,把产品的功能诉求放在第一位。
价格 (Price)
根据不同的市场定位,制定不同的价格策略,产品的定价依据是企业的品牌战略,注重品牌的含金量。
渠道 (Place)
企业并不直接面对消费者,而是注重经销商的培育和销售网络的建立,企业与消费者的联系是通过分销商来进行的。
宣传(Promotion)
很多人将Promotion狭义地理解为“促销”,其实是很片面的。Promotion应当是包括品牌宣传(广告)、公关、促销等一系列的营销行为。

三、数据

1、字段与记录

  • 字段:事物或现象的某种特征,统计学成为变量,如电影、预测、真实、误差等;
  • 记录:事物或现象的某种特征的具体表现,统计学成为数据或者变量值,如哪一个电影,误差结果等。

2、txt文本导入excle中

导入数据–>选择数据源–>选择分隔符–>选择区域

3、 重复数据处理方法

3.1 函数法

3.2 高级筛选法


直接筛选出非重复值

3.3 条件格式法

将重复数据显示出来

3.4 数据透视表

3.5 重复数据删除

4、 缺失数据处理方法

4.1 批量填充


上图存在合并单元格,这是不规范的数据表,无法在此数据表的基础上进行数据分析,那么如何将它转换为规范的数据表呢?

  • 取消合并单元格
  • 空值定位:ctrl+g把所有的空值一次性选中,前提是先保持待选数据区域被选中的状态;

  • 空值填充为所对应的第一个单元格的值。方法:保持空值选中状态–>键盘输入=号–>按下向上的箭头–>ctrl+enter

  • 去除公式:复制,粘贴值

4.2 查找替换

当缺失值是错误标识形式出现的时候,可以采用查找和替换掉的方法,将同一类别的错误标识替换成文本或者数字。快捷键:ctrl+h(替换) 或者 ctrl+f(查找)。

5、 空格数据处理

5.1 查找替换

同4.2方法,查找空格“ ”,替换中不输入任何字符,全部替换,那么所有的空格都会被去除。

5.2 trim函数

有些时候我们不是去除所有的空格,那么如何只去除前后的空格呢,保留名字中间的空格,这里使用trim函数,只会删除字符串前后的空格,中间的空格不会删除。

6、 数据合并

6.1 concat函数

6.2 连接符“&”


注意:concat函数和&连接符合并得到的日期都是字符串类型的,不支持直接的计算。

6.3 日期函数

DATA(year,month,day) 返回表示指定的年、月、日的日期
YEAR(serial_number) 返回某日期对应的年份
MONTH(serial_number) 返回日期中的月份,用整数1-12表示
DAY(serial_number) 返回日期中的天数,用整数1-31表示

6.4 字段匹配

VLOOKUP(lookup_value,table_array,col_index_num,range_lookup)
根据查找值,在数据表的首列搜索制定的查找值,并返回指定的查找值所在行中的指定列处的值。

  • lookup_value:根据什么查找,要查找的值,可以是值或引用;【查找值】
  • table_array:在哪里找,要查找的数据表区域,lookup_value的值必须在tabl_array中处于首列;【数据表】
  • col_num:找到第几列,返回数据在查找数据表区域的第几列,其参数为1时,返回table_array第一列中的值;参数为2时,返回第二列中的值;【列序列】
  • range_lookup:精准匹配(0),模糊匹配(非0值或省略)【匹配条件】

注意“#N/A”出现的情况:

  1. table_array第一列的值不包含要查找的值(lookup_value);
  2. 数据存在空格,此时需要替换或者trim去除;
  3. 共同的关键字类型不一致,此时需要转为一致。

背景介绍:

需要将2表(员工职位表.xlsx)和1表(员工个人信息表(销售部).xlsx)进行关联(工号关联),将职务自动填充到1表的职务中去。

7、 数据抽取

7.1 字段拆分

7.1.1 菜单法

将表中前六位地区编码,中间8位出生年月日、第17位性别编码抽取出来。


7.1.2 函数法

left(text,num_chars) 得到字符串左部指定个数的字符;
right(text,num_chars) 得到字符串右部指定个数的字符;
mid(text,start_num,num_chars) 得到字符串指定位置开始的指定个数的字符。

7.2 随机抽样

7.2.1 rand()函数

返回[0,1]的均匀分布随机数,每次计算都会返回一个新的数值,特别的,当不想随机数改变输入公式后按下F9即可。

扩展公式:
RAND()*(b-a)+a:生成[a,b]之间的随机数。

7.2.2 randbetween()函数

返回一个介于指定数字之间的随机数。

8、 数据计算

8.1 datedif(start_date,end_date,unit)函数

返回两个日期之间的年、月、日间隔数。


8.2 if分组函数


8.2 vlookup函数分组

if分组固然好,但是当嵌套过多的时候,if就显得比较麻烦,因此引入vlookup函数的模糊匹配功能来进行数据分组。

9、 数据转换

9.1 二维表转一维表

数据透视表和数据透视图,多重合并计算数据区域,创建单页字段,选择二维表区域,添加。

9.2 数据类型转换

  • 文本转数值:分列中的常规
  • 数值转文本:同上,用分列中的文本。
  • 数值转日期:同上,用分列中的日期。

数据资源下载

1、学习笔记-谁说rookie不会数分(入门篇)相关推荐

  1. 【web开发学习笔记】Structs2 Result学习笔记(三)带參数的结果集

    Result学习笔记(三)带參数的结果集 第一部分:代码 //前端 <head> <meta http-equiv="Content-Type" content= ...

  2. 学习笔记:Java 并发编程①_基础知识入门

    若文章内容或图片失效,请留言反馈. 部分素材来自网络,若不小心影响到您的利益,请联系博主删除. 视频链接:https://www.bilibili.com/video/av81461839 视频下载: ...

  3. Python3《机器学习实战》学习笔记(五):朴素贝叶斯实战篇之新浪新闻分类

    转载请注明作者和出处:http://blog.csdn.net/c406495762 Github代码获取:https://github.com/Jack-Cherish/Machine-Learni ...

  4. java学习笔记(三):前端miniUI控件库入门

    java学习笔记(三):前端miniUI控件库入门 最近在一家公司实习学习,一上来就需要学习了解相关的前端内容--miniUI.而这个内容自己本身并没有了解学习过,上手也是遇到了不少的问题,于是想把自 ...

  5. Postman接口测试工具学习笔记(一)接口测试概念及Postman入门

    (下文照搬@Storm啊老师博文,留下记录为了方便学习和理解.大家可以去看看原文地址:https://blog.csdn.net/duzilonglove/article/details/786454 ...

  6. 学习笔记:SpringCloud 微服务技术栈_实用篇②_黑马旅游案例

    若文章内容或图片失效,请留言反馈.部分素材来自网络,若不小心影响到您的利益,请联系博主删除. 前言 学习视频链接 SpringCloud + RabbitMQ + Docker + Redis + 搜 ...

  7. 学习笔记:SpringCloud 微服务技术栈_实用篇①_基础知识

    若文章内容或图片失效,请留言反馈.部分素材来自网络,若不小心影响到您的利益,请联系博主删除. 前言 学习视频链接 SpringCloud + RabbitMQ + Docker + Redis + 搜 ...

  8. 学习笔记:SpringCloud 微服务技术栈_高级篇⑤_可靠消息服务

    若文章内容或图片失效,请留言反馈.部分素材来自网络,若不小心影响到您的利益,请联系博主删除. 前言 学习视频链接 SpringCloud + RabbitMQ + Docker + Redis + 搜 ...

  9. 学习版pytest内核测试平台开发万字长文入门篇

    前言 2021年,测试平台如雨后春笋般冒了出来,我就是其中一员,写了一款pytest内核测试平台,在公司落地.分享出来后,有同学觉得挺不错,希望能开源,本着"公司代码不要传到网上去,以免引起 ...

最新文章

  1. ggplot2笔记3:工具箱——误差线、加权数、展示数据分布
  2. 给力开源,.Net开源地址大收集
  3. mysql为什么要重建索引_Oracle 重建索引的必要性
  4. arduino与DS1302时钟调试失败的分析
  5. 容斥原理(二进制枚举)
  6. HashMap 的 7 种遍历方式与性能分析!「修正篇」
  7. java编写大数据分析模型_如何用Java(DOM分析器)编写XML文件
  8. 使用CXF开发WebService程序的总结(七):Spring+CXF+Mybatis+Mysql共同打造的服务端示例...
  9. 【九天教您南方cass 9.1】02 从地形图上绘制纵横断面
  10. 深入探究synchronize锁机制
  11. HTTP 压力测试工具 wrk和ab
  12. Linux关闭swap
  13. [OpenHarmony RK3568] (三)蓝牙芯片适配
  14. 网站的服务器ip变动,网站切换服务器IP,如何快速快速刷新DNS以获得测试?
  15. 【五一创作】使用Scala二次开发Spark3.3.0实现对MySQL的upsert操作
  16. 基于SPSS的主成分分析(PCA)
  17. Windows扫雷游戏代码详解【memset函数】
  18. 多路海康网络摄像头数据实时回调(采用软解码方式)
  19. python实现按键精灵找色点击功能,使用pywin32和Pillow库
  20. 如何利用 Selenium 对已打开的浏览器进行爬虫

热门文章

  1. 最新Exsi-6.7.0U3b版本下载
  2. vba 批量生成条形图代码
  3. 怎么用网线连接开发板
  4. 冬至已至,你的在职读研2023能在社科院与杜兰大学金融管理硕士项目实现吗
  5. 机器学习在脊柱的应用现状:从临床的观点
  6. ORACLE 按时间创建分区表
  7. 软考-高级-信息系统项目管理师
  8. 微信小程序基于云数据库简单实现帖子点赞功能。
  9. Python + Excel 办公自动化 01 —— 硬菜马上就来
  10. 图像的拉普拉斯算子之c++实现(qt + 不调包)