为什么要埋点?埋点如同装在智能机器人身上的传感器,在机器人研发过程中,技术人员将内传感器和电机、轴、手臂、手腕等关键部位安装在一起,实时监控机器人的位置、速度、力度的测量,判断机器人的稳定性与风险,最终实现伺服控制。

传感器是机器人的埋点,网站与 APP 也需要如此埋点。前天策小编发了《埋点最大误区:忽略业务需求》一文,介绍企业在追求精益化数据分析的路上,应如何科学选择埋点方式。本文针对埋点另外两大误区进行剖析:埋点与数据采集、数据分析的关系?如何规避埋点混乱?

误区一:重分析,轻采集!

在追求精益管理的道路上,大多企业深知数据驱动是第一生产力。然而,在企业搭建数据分析平台,或选型第三方数据分析平台时,经常会陷入“重分析,轻采集”的误区。

数据分析是实现数据驱动的前提,固然重要。而数据分析的深度取决于数据采集的质量,顾此失彼,数据驱动道路只能越走越窄。神策数据创始人&CEO桑文锋多次强调,数据采集应该遵循“大”、“全”、“细”、“时”四字法则。

“大”强调宏观的“大”,而非物理的“大”。大数据不是一味追求数据量的“大”,比如每天各地级市的苹果价格数据统计只有2MB,但基于此研发出一款苹果智能调度系统,就是一个大数据应用;

 “全”强调多种数据源。大数据采集讲求全量,而不是抽样。除了采集客户端数据,还需采集服务端日志、业务数据库,以及第三方服务等数据,全面覆盖。

“细”强调多维度数据采集,即把事件的维度、属性、字段等都进行采集。如电商行业“加入购物车”的事件,除了采集用户的 click 数据,还应采集用户点击的是哪个商品、对应的商户等数据,方便后续交叉分析。

“时”强调数据的时效性。显然,具有时效性的数据才有参考价值。

总之,埋点混乱、采集无序则根基不稳,令数据驱动的实现如“空中楼阁”。只有将数据采集和建模等基础搭建好,数据驱动才能真正落地。

误区二:无埋点优越于代码埋点?

数据基础夯实与否,取决于数据的采集方式。埋点方式多种多样,按照埋点位置不同,可以分为前端(客户端)埋点与后端(服务器端)埋点。其中无埋点是目前较为流行的前端埋点方式之一。

“无埋点”概念已烂大街,而在实际进行事件设计与实施的过程中,技术人员有道不尽的爱恨情仇:一方面,无埋点神秘无比,甚至被誉为“最全、最便捷、界面友好、技术门槛低”的数据采集方式;另一方面,运营人员又发出“为何所采数据与业务数据库数值相差这么大?”等各种抱怨。简言之,无埋点采用“全部采集,按需选取”的形式,对页面中所有交互元素的用户行为进行采集,通过界面配置来决定哪些数据需要进行分析,实质与“全埋点”并无无实质差异。

图1 无埋点的优劣势分析

为解释颇具迷惑性的无埋点概念,笔者总结了其优势与劣势。

优势包括:

  1. 可视化展示界面最基本度量,满足基本数据分析需求。

    无埋点可视化展现界面 PV、UV 等网站或 APP 分析的最基本度量,告诉运营人员每个控件被点击的概率是多大,哪些控件值得做更进一步的分析等。如此有助于企业了解用户行为,为进一步数据分析指明方向。

  2.  技术门槛低,使用与部署较简单。

    无埋点极大程度避免了因需求变更、埋点错误等原因导致的重新埋点繁复工作。

  3. 用户友好性强。

    运营人员可以直接应用手指或者鼠标进行操作,自动向服务器发送数据,避免手工埋点的失误。

然而,作为前端埋点的方式之一,无埋点有先天缺陷,带来易用性的同时,也牺牲部分数据的采集深度。无埋点的劣势如下

  1. 无埋点只能采集到用户交互数据,且适合标准化的采集,自定义属性的采集需要代码埋点来辅助。

    每个用户的交互行为均有许多属性,无埋点无法深入到更细、更深的粒度。例如在电商行业中,用户点击“购物车”是一次交互行为,无埋点会忽略掉用户信息、商品品类等其它维度信息,此时需要配合代码埋点来辅助数据采集;再如用户上滑屏幕时,内容瀑布流的底部载入、商品或广告的加载展示、下拉菜单中下拉内容的数据点击等情况,这类自定义行为的采集需要代码埋点辅助实现采集。

    由于无埋点仅适合标准的方案采集,一些数据分析平台也开始支持用户为每个event添加自定义属性,如此能大大扩展事件分析的效能。值得一提的是,神策数据为用户提供的自定义属性无数量限制。

  2.  无埋点兼容性有限。

    例如在安卓系统进行埋点时,不同工程师可能会给APP界面中相同的 button 起不同名称的 ID,当运营人员想筛选出所需数据时,不同名称会给运营人员带来困扰。另外,由于目前第三方框架较多,如 RN 框架,容易造成无埋点兼容性问题。

  3. 无埋点具有前端埋点的固有缺陷。

    无埋点是前端数据采集方式之一,因此具有前端埋点的天然缺陷,如数据采集不全面、传输时效性较差、数据可靠性无法保障等问题。无埋点的技术原理依赖网站或者APP后端技术开发的严谨性与规范性、网络状态、网络口径等因素。

总之,数据采集方式决定所采集到用户行为数据的深度和粒度。夯实数据基础,无埋点需要配合前端代码埋点实现,而前端数据采集的固有劣势,应该结合后端埋点完成。数据采集不准、不全、不细容易让后续数据分析工作陷入“巧妇难为无米之炊”的困境。

综上所属,笔者做出如下总结:

1.数据驱动是第一生产力,数据采集非“大全细时”,则数据驱动如“空中楼阁”;

2.大数据时代≠无埋点时代。“无埋点”顶多个是个“万金油”,功能很多,应急抹一抹,想治病还是难。

埋点套路深,千万别掉“坑”相关推荐

  1. docker springboot读取配置文件_Docker从入门到掉坑(三):容器太多,操作好麻烦

    前边的两篇文章里面,我们讲解了基于docker来部署基础的SpringBoot容器,如果阅读本文之前没有相关基础的话,可以回看之前的教程. Docker 从入门到掉坑​mp.weixin.qq.com ...

  2. 钓鱼网站套路深,上网须谨慎

    网络套路深,遍地都是坑.网页仿冒是通过构造与某一目标网站高度相似的页面诱骗用户的攻击方式.钓鱼网站是网页仿冒的一种常见形式. 所谓"钓鱼网站"是一种网络欺诈行为,指不法分子利用各种 ...

  3. OPPO Reno套路深

    4月10日,经过长时间广告文宣"预热"的OPPO Reno新机终于在上海发布.然而这次发布的OPPO Reno新机,却让期待已久的用户普遍感到失望.消费者议论的话题,已经从对&qu ...

  4. 租电脑考计算机二级.租什么配置,校园租电脑套路深,这个配置要6块钱一天,还电脑的时候还有陷阱...

    原标题:校园租电脑套路深,这个配置要6块钱一天,还电脑的时候还有陷阱 Hello大家好,我是兼容机之家的咖啡. 对于在校学生或者刚毕业并且酷爱游戏的小伙伴,是不是经常往网吧里面跑,毕竟带台式机不方便, ...

  5. 高端微型计算机CPU产品,千万别入坑!来看看现在哪8款处理器不值得考虑

    AMD锐龙处理器的加入让原本沉寂的处理器市场从2017年开始就再度活跃起来,面对对手的压力,英特尔也不得不发布基于Coffee Lake.Coffee Lake-S Refresh核心的第八代.第九代 ...

  6. docker mysql配置 丢失_Docker 从入门到掉坑

    Docker 介绍 简单的对docker进行介绍,可以把它理解为一个应用程序执行的容器.但是docker本身和虚拟机还是有较为明显的出入的.我大致归纳了一下,可以总结为以下几点: docker自身也有 ...

  7. MySQL单表数据量过千万,采坑优化记录,完美解决方案

    MySQL单表数据量过千万,采坑优化记录,完美解决方案 参考文章: (1)MySQL单表数据量过千万,采坑优化记录,完美解决方案 (2)https://www.cnblogs.com/ExMan/p/ ...

  8. android手机短信拦截器,垃圾短信退订套路深 手机上装拦截软件是可行方法

    原标题:垃圾短信退订套路深 手机上装拦截软件是可行方法 应对 相关数据显示,2017年通过某知名手机安全卫士拦截的骚扰电话全年共计380亿次,相比2016年的385亿次略有下降:垃圾短信方面,全年拦截 ...

  9. docker pull 下载一半_Docker 从入门到掉坑

    Docker 介绍 简单的对docker进行介绍,可以把它理解为一个应用程序执行的容器.但是docker本身和虚拟机还是有较为明显的出入的.我大致归纳了一下,可以总结为以下几点: docker自身也有 ...

最新文章

  1. SQL Server技术问题之索引优缺点
  2. JSDOM模型的样例
  3. 【133】常见问题解答
  4. 计算器的程序代码java_求用JAVA编写的计算器程序代码
  5. 使用jqprint插件完成页面打印
  6. P5025-[SNOI2017]炸弹【tarjan,线段树优化建图】
  7. conda 换成清华的源_conda/pip 使用国内镜像安装第三方库
  8. Python数据库连接池DBUtils(基于pymysql模块连接数据库)
  9. Eclipse配置KEmulator
  10. 三创赛优秀作品_创新藏在每一个细节里———记第三届3S杯全国大学生物联网技术与应用“三创”大赛一等奖获奖作品...
  11. 原生小程序 引入vant-weapp 组件库 和 WeUI组件库
  12. 矩阵Jordan标准型过渡矩阵的求解
  13. matlab电磁场与微波技术相关仿真的代码,几乎覆盖电磁和微波领域
  14. 无卷积!金字塔视觉Transformer(PVT):用于密集预测的多功能backbone
  15. 用js脚本写的仿Windows7的扫雷游戏(高仿真)
  16. 电脑ping不通Ubuntu
  17. “即刻搜索”使用率几乎为零
  18. 静态路由实现两台主机互通
  19. windows 禁用 magic mouse2 左右移动
  20. 网易·周星驰·大话西游三周年

热门文章

  1. 一、MySQL日志与备份
  2. python百分号和斜杠_Python中正反斜杠(‘/’和‘\’)的意义与用法
  3. nGQL-为什么路径越长,数量越多呢,直觉是条件越严格,路径数量会越少
  4. 用小括号表达一个长字符串
  5. python argv,Python argv函数简介
  6. 四层负载均衡与七层负载均衡
  7. 信息系统项目管理师考试资料
  8. 信息系统项目管理师考试条件/时间/拿证/价值汇总
  9. Oracle分组后对分组内容重复 取第一个
  10. 笔记-项目范围管理-指导与管理项目工作-控制质量-确认范围-结束项目或阶段...