指标与维度是数据分析中最常用到的术语,它们是非常基础的,但是又很重要,经常有朋友没有搞清楚它们之间的关系,只有掌握理解了,我们的数据分析工作开展就就容易多了。现在就来说说指标与维度的那些事。
1、指标
指标,用于衡量事物发展程度的单位或方法,它还有个IT上常用的名字,也就是度量。例如:人口数、GDP、收入、用户数、利润率、留存率、覆盖率等。很多公司都有自己的KPI指标体系,就是通过几个关键指标来衡量公司业务运营情况的好坏。
指标需要经过加和、平均等汇总计算方式得到,并且是需要在一定的前提条件进行汇总计算,如时间、地点、范围,也就是我们常说的统计口径与范围。
指标可以分为绝对数指标和相对数指标,绝对数指标反映的是规模大小的指标,如人口数、GDP、收入、用户数,而相对数指标主要用来反映质量好坏的指标,如利润率、留存率、覆盖率等。我们分析一个事物发展程度就可以从数量跟质量两个角度入手分析,以全面衡量事物发展程度。
刚才说过,指标用于衡量事物发展程度,那这个程度是好还是坏,这就需要通过不同维度来对比,才能知道是好还是坏。
2、维度
维度:是事物或现象的某种特征,如性别、地区、时间等都是维度。其中时间是一种常用、特殊的维度,通过时间前后的对比,就可以知道事物的发展是好了还是坏了,如用户数环比上月增长10%、同比去年同期增长20%,这就是时间上的对比,也称为纵比;
另一个比较就是横比,如不同国家人口数、GDP的比较,不同省份收入、用户数的比较、不同公司、不同部门之间的比较,这些都是同级单位之间的比较,简称横比;
维度可以分为定性维度跟定量维度,也就是根据数据类型来划分,数据类型为字符型(文本型)数据,就是定性维度,如地区、性别都是定性维度;数据类型 为数值型数据的,就为定量维度,如收入、年龄、消费等,一般我们对定量维度需要做数值分组处理,也就是数值型数据离散化,这样做的目的是为了使规律更加明 显,因为分组越细,规律就越不明显,最后细到成最原始的流水数据,那就无规律可循。
最后强调一点,只有通过事物发展的数量、质量两大方面,从横比、纵比角度进行全方位的比较,我们才能够全面的了解事物发展的好坏。

进一步拓展思考,我理解为指标拆分和维度对比。 其实在实际产品数据分析的过程中也可参照以上思想。 通过大量的数据分析软件工具应用可以发现,主要包括以下内容:

  • 整体情况的分析和汇总:全局数据的概况、变化趋势、占比等
  • 多个维度的分析:如果是日志数据,已经存在多个数据项,以某一个数据项作为主关键词汇总分析,同比、环比变化,占总数的变化。如果没有日志数据,则需要想清楚解决这个问题原因是什么?需要采集哪些数据项?
  • 重要场景问题的分析:根据分析的重要问题、用户关心的问题进行分析
  • 软硬件性能管理、告警管理、报表管理、基础参数配置和用户管理等等

在多维度分析、告警、报表,数据图表可视化设计呈现方面也存在许多共性,总结如下:

  1. 数据的呈现方式是表格还是图表?若是时间范围,时间统计粒度是多少?
  2. 表格需要呈现哪些数据?数据的单位?保留几位小数?数据计算的方法?排序依据?
  3. 图表采用哪一种?呈现的范围是多少?
  4. 常见的数据项操作:新增、删除、修改、查询
  • 新增哪些是必填数据项?校验重复性和有效性?
  • 删除是否需要提醒?是否具有权限删除?
  • 修改可修改的数据项有哪些?修改后是否要进行校验有效性和重复项?是否有修改的权限?
  • 查询是精准查询还是模糊查询?是单一查询还是支持批量查询?批量查询输入方式的讲究?查询的内容输入什么是否支持大小写 空格等?数据区间的查询是自定义还是给出范围划分?

人们总认为与大数据分析沾点边的技术都要花大价钱才能得到。但事实上,大数据分析的思想才是最贵的,技术可以实现数据批量清洗,处理,呈现地更快、更美。但却不知道要哪些数据算有效,哪些数据才是重点需要分析得出有价值的信息。
见贤思齐焉,见不贤而内自省也。

delhpi7 tcombobox清楚重复项_数据分析必须想清楚的两个概念:指标和维度相关推荐

  1. delhpi7 tcombobox清楚重复项_专利数据统计中需要搞清楚的首要问题(2)

    上一篇专利数据统计中需要搞清楚的首要问题(1)介绍了通过合并申请号避免重复统计,理清了专利篇数和专利件数的问题,那么还有一类统计就是对发明项数的统计,这里就涉及到对同一项发明的重复统计问题.上一篇介绍 ...

  2. dau计算公式_数据分析体系 — 用户粘性的两个计算指标(DAU/MAU和月人均活跃天数)...

    很多运营都了解DAU(日活跃用户数)和MAU(月活跃用户数)的重要性,但在某些情况下这两个数值本身并不能反映出太多问题,这个时候就要引用到[DAU/MAU]的概念,即[日活/月活] 用户粘性的两个计算 ...

  3. python列表删除重复项_五分钟学会三种Excel重复项删除方法,工作效率大杀器!...

    点击蓝字 关注我们 在统计数据过程中, 同一份数据可能由于渠道的不同而进行了多次统计, 在输入数据时, 可能因为操作失误重复输入数据.种种原因造成数据表中的数据存在重复现象, 删除重复数据是数据清洗的 ...

  4. 数据透视表里填充重复项_数据透视表填充颜色消失

    数据透视表里填充重复项 Microsoft just announced the winner of their Excel World Champ data visualization contes ...

  5. excel查找一列重复项_列中最后一项的Excel查找公式

    excel查找一列重复项 How can you get the last number in an Excel column? I needed to do that in one of my sa ...

  6. python从后面删除重复项_如何从Python列表中删除重复项

    如何从Python列表中删除重复项 了解如何从Python中的List中删除重复项技巧. 实例 从列表中删除任何重复项: mylist = ["a", "b", ...

  7. python去掉字典重复项_从字典列表中删除重复项python

    我正在尝试从下面的列表中删除重复项distinct_cur = [{'rtc': 0, 'vf': 0, 'mtc': 0, 'doc': 'good job', 'foc': 195, 'st': ...

  8. 如何取消高亮显示重复项_如何将重复数据突出显示?

    将表格中一列数据中重复的,使用特殊颜色突出显示或者使用一些符号标记出来. 例如: 一个供应商,可以邀请别的供应商加入成为联合体,报表要显示所有供应商,然后供应商最后一列显示所有联合体,当联合体供应商跟 ...

  9. sql查询去除视图重复项_如何使用SQL查询视图,Postico使用技巧分享

    Postico凭借着简单易用的操作界面深受专业人员和新手的喜爱,小编也整理一点小技巧分享给大家,通过一次编辑多行节省时间,是你工作的好帮手,快来一起看看吧~ 如何使用SQL查询视图,Postico使用 ...

最新文章

  1. 我又发现了7款特别好用的神仙软件,让人心动!
  2. mysql存储过程执行两边_麻烦问下,为什么我的mysql存储过程一次调用,会被执行了两次?...
  3. WebGL 利用FBO完成立方体贴图。
  4. 【机器视觉】dev_update_on和dev_update_off算子
  5. MFC关键技术-永久保存机制
  6. 事务的4大特性及实现原理
  7. 深入一步研究DNS服务器
  8. Python学习笔记-异常处理
  9. 怎么用命令来查询自己的IP地址?
  10. C++实现binary文件读取(可对‘bil‘,‘bsq‘ float32,double,unchar,unit16,unit8等格式进行读取)
  11. python 获取foobar2000官网全部插件
  12. 身份认证之双因素认证 2FA
  13. 机器学习-入门杂谈(转载)
  14. HTML系列之水平线标签hr
  15. 黑魔法-伪类匹配列表数目实现微信群头像CSS布局的技巧
  16. 智能优化算法:白鲸优化算法-附代码
  17. 怎样根据电阻上的色环,判断电阻的大小
  18. 国密双证书签发及国密数据信封解析
  19. c语言中scanf返回值被忽略,返回值被忽略scanf是什么意思
  20. 解密「UWB」精准定位黑科技

热门文章

  1. 步步为营-17-FileStream-文件加密/解密
  2. 查看sqlserver 2008中性能低下的语句
  3. VS2010 C# 4.0新特性一览
  4. 1000道Python题库系列分享13(22道填空题)
  5. Python+sklearn使用支持向量机算法实现数字图片分类
  6. Python爬虫辅助库BeautifulSoup4用法精要
  7. Python统计模块statistics用法精要
  8. 聚簇索引和非聚簇索引的区别_学习索引的一些总结
  9. python怎么命名未知数_Python4要来了?快来看看Python之父怎么说
  10. 矩阵分析——第一章 线形空间和线性变换