浅谈用户行为分析(一)

标签(空格分隔): 数据仓库 用户行为分析


关于用户行为分析,很多互联网公司都有相关的需求,虽然业务不同,但是关于用户行为分析的方法和技术实现都是基本相同的。作者在两家公司都了用户行为分析的相关事项,分享一下自己的一些经验。

一. 简介

用户行为分析可以概括如下:哪个用户在什么时候做了什么操作在哪里做了什么操作,为什么要做这些操作,通过什么方式,用了多长时间等问题,总结出来就是WHO,WHEN,WHERE,WHAT,WHY以及HOW,HOW TIME。

二.基础数据

根据以上5个W和2H,我们来讨论下们如何实现。
WHO,首先需要x获取登陆用户个人的信息。用户名称,角色等
WHEN,获取用户访问页面每个模块的时间,开始时间,结束时间等
WHAT,获取用户登陆页面后都做了什么操作,点击了哪些页面以及模块等
WHY,分析用户点击这些模块的目的是什么
HOW,用户通过什么方式访问的系统,web,APP,小程序等
HOW TIME,用户访问每个模块,浏览某个页面多长时间等
以上都是我们要获取的数据,获取到相关数据我们才能接着分析用户的行为。

三.技术实现

有了上面的思路,下面我们来说下实现的相关技术问题,如何落地用户行为分析。
a).首先是获取用户行为数据,目前比较多的方法有两种,一种是埋点,一种是插码(业内称无埋点技术)。先说下两种方式,第一埋点,埋点能够针对特定的页面位置获取用户的访问数据,能够更加精确的获取用户的访问动作等信息,没有其他杂乱数据,我们需要什么数据,就在页面对应的位置埋点就行。第二是插码,第一次听说这个技术是当时看到GrowingIO提出来的,个人认为这种技术其实是全埋点,也就是,你从登陆访问的所有信息都会被收集到,数据很多,也常常会遇到数据丢失的问题。(个人不是擅长前端,可能有更好的方法解决)。
b).获取到的用户的访问日志数据,是否就能用了呢?不行,这样收集到的数据很不规范,日志很乱,所以此时需要后端和前端定义好数据的保存格式,也就是保存哪些字段内容,需要把埋点数据按照约定的格式统一封装,以便于存储分析。
c).数据封装好后如何存储呢,我们知道对于互联网公司来说,用户的访问日志是非常大的,所以需要用户大数据存储技术,比如存储到HDFS上就是一个不错的选择。用户的访问日志都是实时产生的,如何落地到HDFS上呢?第一,埋点数据可以先落到磁盘,然后通过FLUME监听对应的磁盘目录,进行转发到HDFS,推荐使用kafka channel。第二,可以将用户访问的数据转发的一个特定的端口,使用FLUME监听对应的端口号,进行转发落地到HDFS。(期间,需要给FLUME足够的资源,注意进行心跳监控)。数据落地HDFS后,离线可以使用Hive SQL或者Spark SQL 进行分析。
对于离线分析,上述步骤,可以获取数据分析,对于个别实时需求,计算时则不需要进行落地HDFS,直接利用Storm,Spark Streaming,Flink等计算引擎消费Flume中转的kafka数据即可。

后面会讲解一下用户行为分析的一些指标怎么做……

后续更新也会在博客更新:qinchaofeng的博客

浅谈用户行为分析(一)相关推荐

  1. 让数据站住脚-浅谈用户研究中的信度与效度

    让数据站住脚-浅谈用户研究中的信度与效度 在用户研究工作中,如何让自己的数据和结论更有说服力,是很重要的问题.最近将自己积累的用研信度和效度的笔记整理一下,罗列在文中,希望对大家有所帮助. 一.调查的 ...

  2. 浅谈用户密码保护与相关技术

    浅谈用户密码保护与相关技术(上) 一.  全文涉及 上篇:哈希,彩虹表 下篇:加盐加密,慢哈希,非对称加密与HTTPS 二.  主题引入 2011年12月21日,CSDN后台数据库被黑客恶意发布到互联 ...

  3. 浅谈通过缺陷分析进行项目质量分析

    本篇文章浅谈如何进行测试缺陷分析和质量报告分析. 背景 如同代码是程序员的成果之一,测试报告和质量报告是测试人员的主要成果之一.对于一个测试,在测试项目结束时需要对测试过程中的典型bug.常出现bug ...

  4. 浅谈用户研究那些事(上)定性研究

    什么是用户研究 从"用户研究"这四个字来看: 一是用户:所谓的用户,就是我们产品定位中涉及到的目标用户,是产品的使用人群.所以在用户研究时首要任务就是要明确产品的目标用户.目标用户 ...

  5. 推荐 :浅谈用户全生命周期管理

    导读: 今天我们邀请到了云音乐的张毅老师,给大家分享他对于用户全生命周期运营的思考和总结,从定义到周期划分,用户分层定义,到后续运营策略方式,系统建设.数据体系等逐步探讨. 一.用户生命周期定义 Li ...

  6. 线上分享 | 浅谈用户生命周期运营

    作为互联网从业者,你可能在很多地方都看到过"用户生命周期"这个词.如果用户必定流失,那就要尽一切可能延长用户的生命周期,并且产生商业价值. 本次分享会带你划分用户结构,用RFM模型 ...

  7. 浅谈用户体验的 4 个维度

    本文为PMCAFF作者 SnowDesign 于社区发布 首先,用户体验的 4 个维度为: IX:Interface Experience,人与界面的交互体验 CX:Content Experienc ...

  8. 浅谈软件可视化分析内存消耗综述中的识别方法

    大家好,我是谢易均,我在OpenHarmony成长计划啃论文俱乐部里,跟着九联CTO郑总参与啃论文俱乐部活动. 目录: 一.引言 二.识别方法概览 三.识别方法详解         一:定义研究问题( ...

  9. 大数据杀熟的背后 -- 浅谈用户画像

    ​A有一天在某电商平台搜了"连衣裙",惊呼:"xx上的裙子好贵啊,怎么都要四五百?".B接话:"不能吧,我看看,哎?我这就两百多啊".胖里默 ...

最新文章

  1. 【图解】最流行的7个JavaScript 框架各自的优点
  2. python绘制分组条形图_python中分组值的条形图
  3. python selenium iframe怎么定位_python+selenium 切换iframe
  4. 使用sublime的SQLTools插件访问MySQL的配置方法
  5. 2021年基金什么时候布局?
  6. 华为专利全球第一:哪里跌倒,哪里爬起!
  7. TakeColor鼠标位置不对/取色不准
  8. 严蔚敏版数据结构视频讲解
  9. C语言中期报告格式,本科论文中期报告范文_本科毕业论文中期报告模板(2)
  10. 功能测试报告模板_接口测试用例和报告模板
  11. 用什么来做用户行为分析?七个实用工具推荐给你
  12. 便签数据怎么恢复 有能恢复手机便签数据的方法吗
  13. mysql前一天的数据_mysql查询前一天数据-mysql根据时间查询前一天数据-吾爱编程网...
  14. TJPU-36 大数阶乘
  15. 基于CentOS的分布式文件系统GlusterFS安装、集群搭建和运维
  16. 机器学习和深度学习路线
  17. OpenMLDB 开源一周年,感恩遇见
  18. cocos creator 的一些组件监听类型
  19. MySQL学习笔记(狂神说Java)
  20. 俩万搭建安装SpringBoot+VUE【视频+文档+源码】

热门文章

  1. AI芯片:寒武纪Cambricon-X结构分析
  2. 《算法零基础100讲》(第20讲) 进制转换(二) - 进阶[C语言题解]
  3. Autojs-QQ每日定时给女票/男票/闺蜜/基友发送一句话
  4. 【Opencv】基于python-opencv的CV2实现图片OCR前的扫描摆正OCR识别【代码实现】
  5. [leetcode Q50] Pow(x, n)
  6. form-create-desniger 自定义拖拽表单
  7. 艾比森发布新一代高端Micro LED微间距显示产品
  8. thymeleaf中 th:href使用笔记
  9. Google排名查询的8个方法
  10. 万字详解大数据平台异地多机房架构实践