今天刷微博发现#31省结婚离婚大数据#上了热搜,一时讨论热火朝天。

民政部门公布的数据显示,2020年我国结婚登记数据为813.1万对。我国的结婚率不断下降,而离婚率却持续上升,这一趋势引发了媒体和普罗大众的广泛讨论。一时之间,我国的婚姻制度显得岌岌可危,不婚主义似乎已经成为年轻人中的主流。

在诸多令人震惊的讨论背后,我们发现,不少大众对数据指标的误解,将比例指标视作率指标。

比如下图盛传的天津高达76.4%并不是离婚率,而是离婚结婚比

但是,我们的离结率真的高达76.4%了吗?中国人真的都不愿意结婚了?

  • 那在这些夺人眼球的标题和数字背后,中国真实的婚姻状况又是什么样的?
  • 结婚率、离婚率、离婚结婚比的内涵究竟是什么?这些指标又能否反映我国真实的婚姻状况?
  • 究竟应该用哪种方式、哪些指标来分析一个人口、社会的婚姻模式以及结婚、离婚和不婚水平?

这里就要提到一个经典的数据分析法:同期群分析

什么是同期群? 

相同时间内具有相似或特定属性 /⾏为的群体我们称之为同期群(时间+特定属性)。

什么是同期群分析?

同期群分析(Cohort Analysis)的主要目的是分析相似群体随时间的变化而变化

简单来说,就是将⽤户进⾏同期群划分后,对⽐不同同期群组⽤户的相同指标就叫同期群分析。

首先民政部每年公布的结婚率与离婚率,实际上是粗结婚率和粗离婚率,即以结(离)婚对数除以当期平均人口数,这两个指标数据计算较为简便,也能够反映出一定时期内人口结婚和离婚事件的发生频率。

但是,婚姻事件是在一定年龄范围内的人口中才会发生,粗结婚率和粗离婚率的分母(即当期平均人口数)并没有排除掉非适婚年龄的人口,因此会受到人口年龄结构的影响。

如果人口中非适婚年龄的人口比重不断增加,那么即使适婚年龄人口中的结婚水平和离婚水平没有发生变化,也会使粗结婚率和粗离婚率呈现出下降的趋势。

而离婚结婚比的分子是那些经历了一段时间婚姻生活后选择在2020年离婚的夫妻,分母则是2020年才登记结婚的夫妻,分子和分母并不存在包含的关系,而是两批基本上毫无关系的夫妻。

也就是说,离婚结婚比并不等于一个队列中的离婚率,而只是同一时期从未婚状态进入已婚状态和从已婚状态进入离婚状态的人数之比,它并不能表示已婚有配偶者中有多少对离婚了,因此也不能准确地反映一个人口真实的离婚状况。

回到我们做产品分析上又如何利用同期群分析呢?

这里在提到同期群分析的同时,有必要先引入产品用户生命周期的假设:即大部分产品的用户的使用行为是随使用时间的推移呈阶段性变化的。

以微博为例:

点击添加图片描述(最多60个字)编辑

  • 用户刚开始使用时,对功能不熟悉,关注和粉丝都很少,能获得到的有价值内容有限,因此使用频率较低,互动(评论、点赞)和发内容的行为很少。这个阶段,暂且定义为初期使用阶段。
  • 随着时间推移,用户逐渐建立起了自己的关系网络,并且关注了很多感兴趣的博主,这时用户使用的频率非常高,每天花大量的时间在阅读、评论、回复、发内容上。这个阶段,姑且定义为频繁使用阶段。
  • 时间的脚步向前不停,用户逐渐发现每天花在微博上的时间太多了,而且每天看来看去就是那些内容,逐渐产生了厌烦(兴趣丧失),恰好这时,很多其他有趣的应用如雨后春笋般展露,吸引并占用了用户的不少时间(兴趣转移),用户使用微博的时间减少了很多,而且发微博、评论也不那么及时了。这个阶段,勉强叫兴趣降低阶段吧。
  • 再后来,用户对微博已经没有新鲜感,兴趣已基本丧失,可能隔很多天才偶尔打开一次(甚至不再打开),而且基本不再发新微博。这个阶段,跟着叫兴趣丧失阶段吧。
  • 再再后来,彻底不用了(甚至换新手机后都不再安装微博了)……

对于微博来说,用户从初期使用、频繁使用,到兴趣降低、兴趣丧失,到完全不用,就是用户的生命周期。

而对产品的用户行为进行同期群分析,是管理和改变用户生命周期的基础。

比如针对首次启动APP的用户进行同期群分析,并观察他们接下来4周的留存情况。

点击添加图片描述(最多60个字)编辑

  • 横向对比:横轴是周期,以一周为一个周期,分析从一个周期到4个周期的用户留存率;从横向看,是一个群组的前后对比,比较在不同周期内的用户留存率,量化用户留存率的变化趋势
  • 纵向对比:纵轴是同期群,以一周来划分不同的分组,每一个分组都确定一个同期群。从纵向看,是多个不同群组的对比,比较多个群组在相同周期内的用户留存率。

当对产品进行迭代更新时,通过比较不同的同期群,可以从总体上看到,产品的表现是否越来越好了,从而验证产品改进是否取得了效果,量化改进的效果。

我们还可以比较不同时间段的留存:

  • 比如通过比较拉新后不同的同期群,我们可以看到4天,7天等时间段后再次回来的用户。
  • 再比如通过观察每个同期群用户再次回来使用APP的天数,我们可以看到每个同期群长期的留存,而不是拉新后几天的留存。

我们可以知道用户是在哪里退出的,并且可以知道活跃用户群有什么特征,他们在做什么,这样一方面有助于我们在拉新时快速找到目标用户,另一方面我们还可以影响新用户,让他们遵循同样的路线,最终成为忠诚用户的模样。

用户行为的生命周期可以通过同期群分析来取得,并可以通过对产品的改进来影响用户的生命周期,这应该就是同期群分析的魅力所在。

如何实施?

做同期群分析,最常用的工具是用户留存表,也就是前面例子中的表格。

用户留存分析,是将用户的行为分为:

  • 初始行为:如“首次打开应用”、“成功注册”或“第一次购买”;
  • 留存行为:可以是用户的任意一种行为,或某个特定的行为(如“购买”,或“分享到社交网络”);

通过将用户按初始行为的发生时间分组(得到同期群),然后再统计初始行为时间后不同时段内留存行为的发生频次(或时长,或其他有意义的计量,比如消费金额),制成表格就得到了用户留存表。

不过,在进行用户留存分析时,有个非常重要的问题要注意,即:

  • 不是用户的所有使用行为都对产品有价值。
  • 分析用户留存,一定要找到价值行为,分析用户的价值留存,才会对产品改进产生更大的帮助。

具体来说,就是如何定义留存行为。如果只是简单的将留存行为等同于任意行为,这样得到的分析结果,不能真实的反映出用户的使用与产品的实际经营状况之间的关系,反而可能会给产品人造成一片繁荣的假象,导致产品改进走向“叫好不叫座”的误区。

最后

同期群分析的目的在于透过现象找到结果,是一种重要的数据分析方法,更重要的是其背后的思考方式,一旦熟练掌握了它,在许多场景下都能加以运用并创造价值。

那再看回这个热搜,无论是粗结婚率、粗离婚率还是离婚结婚比,都只是时期指标,只能一定程度上反映出我国的婚姻状况,既不能反映婚姻状态的动态变化过程,更不能反映终身婚姻水平。

中国人离婚率高达76.4%?这些指标背后真实的状况到底是什么样的?相关推荐

  1. 程序猿的骄傲,以及骄傲背后真实的原因

    转载 作者:zuoxiaolong(左潇龙) 出处:博客园左潇龙的技术博客--http://www.cnblogs.com/zuoxiaolong 引言 程序猿,这个字汇在近几年开始渐渐被大众所熟知. ...

  2. 数据指标 VS 标签体系,到底有啥区别?

    1.数据指标 VS 标签体系,到底有啥区别?终于讲清楚了 1.1.数据指标,具体数字描述(比如,他身高180cm,体重200斤). 1.2.数据标签,概括性描述(比如,他是大胖子:他是高富帅):好的标 ...

  3. 程序猿的骄傲,以及骄傲背后真实的原因。

    引言 程序猿,这个字汇在近几年开始渐渐被大众所熟知.在外界看来,这一直是个特殊的群体,社会上也给程序猿贴了很多的标签,内向.屌丝.苦逼.裤衩.拖鞋等等.在他们的心中,程序猿是这样的. 同时,程序猿也被 ...

  4. 水晶苍蝇拍:聊聊估值那些事儿——“指标”背后的故事 (2011-11-01 14:58:32)

    [<证券市场周刊>特约作者 李杰](注:本文为原文,部分地方与刊登版有细微差异). 虽然企业的内在价值的经典衡量方式是DCF(现金流贴现法),但这种方法的天然限制因素(比如计量比较复杂.只 ...

  5. 免费开放!清华、智源、协和联合开发乳腺癌AI诊断工具,可预测分子亚型,准确率高达76%...

    文:贾伟 使用AI技术来检测乳腺癌,如今已有诸多研究,但大多是基于磁共振.乳腺X线影像进行预测.而超声是中国女性乳腺癌筛查的主要方式.如何利用好超声影像,进行乳腺癌筛查,并对乳腺癌做分子亚型分类,是中 ...

  6. 如何分析风控核心报表,指标背后代表怎样的逻辑

    以下进入学习正题 首先,我们带着问题去学习,我们风控人员为什么需要报表?是由谁来制作? 问题一:风控报表是由谁来制作的呢? 风控部门中,通常审批策略.催收.反欺诈.建模的工作人员会对报表比较重视. 审 ...

  7. 人脸识别门禁方案汇总和应用分析,解析指标背后的含义

    现在大家讲的人脸识别往往说的是可见光人脸识别,这里我也不再探究传统红外人脸识别的方案了,都已经是过去式. 先看看人脸识别门禁方案的种类,常见的方案有3种:纯CPU型,GPU型,NPU型,纯CPU型中又 ...

  8. 转:中国人须知道的76个常识

    1.[十二生肖] 子鼠.丑牛.寅虎.卯兔.辰龙.巳蛇.午马.未羊.申猴.酉鸡.戌狗.亥猪 2.[十大名茶] 西湖龙井(浙江杭州西 湖区).碧螺春(江苏吴县太湖的洞庭山碧螺峰).信阳毛尖(河南信阳车云山 ...

  9. 华为鸿蒙研发团队负责人,走进华为北研所:EMUI 11 背后的“人因研究”到底是什么?...

    智东西(公众号:zhidxcom) 作者 | 云鹏 编辑 | 漠影 智东西 11 月 26 日消息. 一出稻香湖路地铁站,远远地我就望见了大山,山川的轮廓隐约的铺就在那里,入冬的北京,伴着微微的风,空 ...

最新文章

  1. 使用java实现面向对象编程试题答案,面试题+笔记+项目实战
  2. 遗传所屠强研究组开发Decode-seq方法显著提高差异表达基因分析的准确性
  3. mtensor一个tensor计算库,支持cuda延迟计算
  4. 防盗链与token运用
  5. 计算机应用基础选择题综合十,计算机应用基础选择题综合复习练习题
  6. 「代码随想录」121. 买卖股票的最佳时机【贪心】【动态规划】力扣/leetcode详解
  7. c语言关于指针的编程题,C语言指针编程题
  8. 在Ubuntu20.04(Linux Mint)中同步通达信软件的自选股和画线数据
  9. 计算机控制系统在电厂的应用,【2017年整理】计算机控制系统在火电厂中的应用...
  10. 7z文件linux怎么解压,Ubuntu 12.04下解压7z文件
  11. 计算机网络技术人员素质要求,做网络技术员需要学习哪些技能
  12. [转]互联网系统架构的演进
  13. ios个人小游戏开发者如何做到年收益过百万?
  14. 自整理---Mysql高级笔记
  15. MySQL高级:索引优化之防止索引失效
  16. 人工智能实战2019第七次作业(OpenPAI) 16721088 焦宇恒
  17. 平淡生活:过年的一点感慨
  18. c++工作宝贵经验呀,我去。。。。
  19. 网络:TCP与UDP
  20. 11款相似图片搜索引擎推荐,以图搜图将不再是难事

热门文章

  1. canvas实现矩形框,用来进行图片框选
  2. 经典文章:一位营销总监的辞职信及回复
  3. 个人项目-网络电话呼叫客户端 (一)
  4. 使用ScanShadowsFilter过滤激光雷达拖尾
  5. 微信支付之App支付
  6. sqlserver数据库18456错误怎么解决?
  7. Flutter学习日记之使用路由进行页面切换
  8. 不懂英文能靠建站卖站达到月入上万?
  9. 域权限维持——黄金票据和白金票据
  10. Python自动化 | 通过键盘控制鼠标来玩赛尔号