原文数据分析师对标签、指标、维度、字段等的思考(指标体系标签体系) - 知乎

1.前言

作为数据分析师工作中经常会接触要标签,指标,字段,维度,属性等,但它们之间有什么区别,怎么定义,相互之间有什么关联呢?这个问题,我无法作出直接的回答,也没想过去整理,归纳与总结,直到有一次领导问我相关问题,把我问蒙了,书到用时方恨少,都怪自己没有做过总结!

所以,经过上次的事件,周末我抽空花了时间查阅资料再结合自己的理解整理了一篇总结性文章。(属于个人总结,有不合理的地方,欢迎大佬到评论区指出,大家共同进步,谢谢!

2.是什么

我们先对标签、指标、字段、维度、属性等下个定义,先解决是什么的问题?

2.1标签

标签的定义:用户标签是构成用户画像的核心因素,是将用户在使用某个产品时所产生的行为数据(注册,访问,浏览,点击,下单,注销等),通过分析提炼后生成具有差异性特征的形容词。

举例说明,最常见的:QQ的个性标签,微信好友的标签等

标签的分类:

(1) 按标签类别

统计类标签,规则类,机器学习类(参考赵宏田老师的《用户画像方法论与工程化解决方案》)

(2) 从维度来划分

用户属性类,用户行为类,用户消费类,风险控制类标签

2.2指标

指标的定义:指标是指将业务单元细分后量化的度量值,让复杂的业务流程可描述、可度量、可拆解,它是业务和数据的结合,是统计的基础,也是量化效果的重要依据。例如:达标率,合格率,成交量,退货率,次品率。

指标的分类:指标常用方法是指标分级方法和OSM模型

2.3维度

维度的定义:维度主要分为定性维度和定量维度。(1)定性维度,主要是偏文字描述类如省份、性别、活跃度等;(2)定量维度,主要是数值类描述如收入、年龄等,对定量维度需要做数值分组处理。

指标体系和标签体系是由不同的维度组成,而维度是指用户观察、思考与表述某事物的“思维角度”,没有维度,单纯说指标和标签是没有任何意义的。

2.4属性

属性的定义:事物的性质和关系,统称为事物的属性。

属性的分类:自然属性和社会属性

2.5字段

字段的定义:在关系型数据库中,表就是一个数据的集合体,可以理解就是一个二维数据表格。字段是指表格中的列,即具有相同属性的数据集合。每个字段都有相应的描述信息,如数据类型、长度,注释等,而且每个字段都必须有一个唯一的名称,称为字段名。如下图,三个字段:准考证,科目,成绩。在数据库中字段是最基础的数据,包含所有的指标数据和标签数据。

《潜意识:控制你行为的秘密》的作者蒙洛迪诺说,人做判断的时候有两种机制:

一种是“科学家机制”,先有证据再下结论

一种是“律师机制”,先有结论再去找证据

生活中大多数都是“律师机制”,先有结论再去找证据,对于本次讨论的标签、指标、字段、维度、属性。我觉得属于律师机制,数据分析最终是研究用户画像,用户画像就是给用户打各种各样的标签,标签由属性、指标和维度共同确定,怎么得到属性、指标和维度呢,最细的数据就是保存在数据库中的字段。

3.为什么

记得新版电视剧《亮剑》赵刚和李云龙有过一段对话:

团长李云龙:打仗就是打仗,哪有那么多弯弯绕?

政委赵刚:不解决为什么打仗问题,那不是瞎打么?

在知道标签、指标、字段、维度、属性是什么之后,还要明白建立标签体系和指标体系的意义和目的?

主目标:一切为了发展

次级目标:BI报表,经营分析,精准营销,个性化推荐等等服务于业务

4.怎么做

知道是什么,为什么?接下来怎么落地呢,就要解决怎么做的问题?怎么做是个大命题,这不是一个人的能做的,如下是一个简单的人员配置表。

当接到任务时,提醒自己不要慌!我们自己要知道是什么,为什么,至于怎么做就看自己处于什么角色,不要求啥都会,只需要处理好自己角色分内的事情之后,在多了解其他角色的工作就已经很优秀了。

5.总结

本文主要从标签,指标,字段,维度,属性,是什么,为什么,怎么做?展开论述,探讨了是什么的,明确标签,指标等具体定义,明确建设指标体系和标签体系的意义和目的,接着简要说明了这么做的问题,怎么做是个大命题,我们要清楚自己在其中参与的角色,起到什么样的作用,在完成任务的同时思考怎么做的更好就已经很优秀了。

数据分析师对标签、指标、维度、字段等的思考(指标体系标签体系(转自知乎)相关推荐

  1. 同样是数据分析师,他靠“打标签”总被夸,我天天加班取数还被骂

    转载/码工小熊 大家好,我是爱学习的小熊妹. 今天跟大家分享一个和指标体系同等重要的技能:构造标签(俗称:打标签).打标签能力,是区分真数据分析师和sqlboy的重要能力 一.什么是标签? 标签是对事 ...

  2. 【视频特辑】数据分析师必备,快速制作一张强大好用的大宽表

    简介:随着企业数字化进程的逐步推进,在日常经营过程当中会沉淀下越来越多的数据信息. 每当想做数据分析的时候,就会发现想要的指标分散在不同的数据源.数据集.数据表当中. Quick BI的数据关联功能, ...

  3. 月薪3000和30000的数据分析师差在哪?

    这是我的第60篇原创 我看到有些人抱怨,BI数据分析师的前途暗淡,整天就在提数提数,没有出头之日. 咱埋头走路,有时候也得抬头看看路啊.你能不能大胆的猜一猜,数据分析师的薪资上限究竟是多少? 3000 ...

  4. 数仓中指标-标签,维度-度量,自然键-代理键,数据集市等各名词解析及关系

    序列号 内容 链接 1 大数据知识面试题-通用(2022版) https://blog.csdn.net/qq_43061290/article/details/124819089 2 大数据知识面试 ...

  5. 数仓中指标-标签,维度-度量,自然键-代理键等各名词深度解析

    作为一个数据人,是不是经常被各种名词围绕,是不是对其中很多概念认知模糊.有些词虽然只有一字之差,但是它们意思完全不同,今天我们就来了解下数仓建设及数据分析时常见的一些概念含义及它们之间的关系. 本文首 ...

  6. 口径、维度、指标和字段

    口径.维度.指标和字段 比如,要得到北京地区,上海地区,深圳地区的销售总额. 字段:一般关系型数据表的表头都是由字段组成. 前提是已经有一张表. 口径就是完成这个需求的逻辑:首先对地区字段进行分组,然 ...

  7. 七周成为数据分析师 第二周:业务篇-指标

    七周成为数据分析师 第七周:Python - CSDN博客 七周成为数据分析师 第六周:统计学 - CSDN博客 七周成为数据分析师 第五周:Mysql - CSDN博客 七周成为数据分析师 第四周: ...

  8. python使用pandas通过聚合获取时序数据的最后一个指标数据(例如长度指标、时间指标)生成标签并与原表连接(join)进行不同标签特征的可视化分析

    python使用pandas通过聚合获取时序数据的最后一个指标数据(例如长度指标.时间指标)生成标签并与原表连接(join)进行不同标签特征的可视化分析 目录

  9. a标签去除下划线css_数据分析师所需的编程技能 : CSS篇

    Html篇里提到过css是啥,CSS样式是表现.就像网页的外衣.比如,标题字体.颜色变化,或为标题加入背景图片.边框等.所有这些用来改变内容外观的东西称之为表现. 1.一个CSS样式示例: CSS全称 ...

最新文章

  1. 2021 AAAS Fellow名单出炉!图灵奖得主Yan LeCun、联想芮勇等多位人士入选
  2. TypeScript 交叉类型(intersection type)
  3. 密码学专题 证书和CA指令 申请证书|建立CA|CA操作|使用证书|验证证书
  4. mysql 联合质检_第三次全国国土调查-统一时点更新阶段数据库质检规则业务细则解释(三)...
  5. 将Windows日志转换为Syslog
  6. 新华三的背景_开放融合创新:新华三全力支撑运营商5G赋能百业
  7. python支付_玩转京东支付(python)
  8. win10默认壁纸_Win10瞬间审美爆炸,5分钟一键美化,不输万元Mac!
  9. 抽帧定格动画如何制作?AE制作哈利波特定格动画教程
  10. win10 -- 增加新建 TXT 文档快捷键
  11. 学python-当当发布2020程序员新态:左手Python,右手机器学习
  12. 云计算技术基础【9】
  13. tomcat访问localhost:8080不能显示tom猫页面的问题
  14. java系统爬塔游戏,如何玩爬塔游戏?一目了然,每天只需2分钟
  15. 块储存、对象存储、文件存储的区别和联系
  16. css效果之吸顶效果
  17. 1218:取石子游戏
  18. 使用API进行FTP文件上传和下载
  19. 装完服务器打补丁,看看有谁比我更无聊~
  20. avast! Home/Pro 4.7.1098简体中文

热门文章

  1. 数据库建一张学生表,要求有姓名,性别,年龄,班级,成绩字段
  2. 计算机图形学国际知名会议与期刊
  3. UE5 CommonUI初学笔记
  4. JS实现 腾讯视频弹窗功能
  5. python删除文件中指定内容
  6. 项目1之分层随机分组
  7. 使用线性回归对身高体重数据集分析
  8. python ipados_iPadOS 会让 iPad 变成生产力工具吗?
  9. elasticsearch查询篇
  10. python删除文本最后一行_用python删除文件中的最后一行