Researsh百度统计,记录此过程中的点滴和自己的看法

百度统计是什么?
一款专业网站流量分析工具,能够告诉您访客是如何找到并浏览您的网站,以及如何改善访客在您网站上的使用体验。。。。。。不多罗嗦,此处省略N百字
带着一些问题去研究
  • 访客属性:通过对您网站页面的监测,分析访客行为,刻画出您网站的访客属性,主要包括性别、年龄、职业和学历四个部分。这个属性怎么搞出来的,原理是什么?
    答案:访客属性是拿着访客的baiduid去passport那边获取的。大概就是passport建立了一套用户属性的服务,可以使用baiduid去取,不需要userid。
  • 平均停留时长:访客浏览某一页面时所花费的平均时长,页面的停留时长=进入下一个页面的时间-进入本页面的时间。那么第一页如果没有跳转是否有平均停留时长?
    答案:根据访客浏览两个页面之间的时间间隔来计算页面停留时间,当访客访问一个页面后没有再访问下一个页面,便无法得知访客在该页面的停留时间
  • 忠诚度是什么计算逻辑
    答案:忠诚度就是记录访客在一个月内的访问次数,次数多的忠诚度就高
  • 热力图是用户点击、鼠标移动得到的热力分析,还是其他?
    答案:热力图监控的是鼠标点击
  • 异步请求怎么统计
    答案:有JSAPI叫_trackPageview,用于发送某个指定URL的PV统计请求,通常用于AJAX页面的PV统计。
    详情还得看官方文档,地址 http://tongji.baidu.com/open/
  • 百度统计有流量限制吗?
    答案:不做任何流量限制,目前可稳定支持“每日千万以上PV”的站点流量统计和分析
  • 百度统计和站内统计数据不一样是为什么?
    答案:
    a.定义不同。如访客在未关闭浏览器的情况下30分钟内N次(N>1)访问网站,百度统计会视为1次访问
    b.跟踪技术。有基于浏览器Cookie、flash Cookie、IP+用户代理(基于IP+用户代理的方式,一般是分析日志文件来获取数据,但无法排除蜘蛛程序等来源的点击量,通常会比基于COOKIE的跟踪方式获取的流量数据更高)
    c.还有不少不一一列举,可查看 http://yingxiao.baidu.com/support/tongji/detail_2755.html
百度统计不能做什么
  • 不支持添加中文域名
  • 用户过少时很多报表和数据没有数,如访客数据(样本量过少不足以分析网站的访客属性)
  • 不能让你的站点起死回生...
有意思的关键点
  • 忠诚度:访客在您网站上的访问行为特征分布。通过访客忠诚度报告,您可以及时了解访客在您网站的行为规律以及对您网站的忠诚度。 
  • 页头访问次数:访客抵达网站页头的次数。如果您的网站打开速度太慢,或网站内容不吸引人,访客可能未等页面完全打开就离开了网站,此时计入页头访问次数,但不计入访问次数。
  • 访问时长和最后一页的关闭时间:百度统计于2012年11月1日起对访问时长算法进行优化,针对未能收到关闭时间的页面将采取以下优化方法:  1)  用户一次访问中只访问了一个页面而该页面的关闭时间未收到,则系统赋予该页面一定定值作为访问时长;  2)  用户一次访问中涉及到n(n≥2)个页面,其中第n个页面的关闭时间无法收到,则系统将前 (n-1)个页面的平均访问时长作为第n个页面的访问时长。以上调整会使得平均访问时长较原来有一定程度的下降,却更符合用户真实访问行为。
  • 访问深度: 访客一次访问会话中浏览的不同页面数
  • 访问频次: 访客一天内在网站上的访问会话总次数
  • 访问页数: 访客一次访问会话中的页面浏览量,即同一页面多次被浏览累计
  • 流失率:对指定路径对应的步骤而言,访客从该步骤进入到下一个步骤的过程中流失的比例。 本步骤的流失率=(本步骤的进入次数-下一步骤的进入次数)/本步骤的进入次数。
  • 老访客: 今日之前有过访问,且今日再次访问的访客,记为老访客。
  • 跳出率:只浏览了一个页面便离开了网站的访问次数占总的访问次数的百分比。 子目录的跳出率是指只浏览子目录中一个页面便离开的访问次数占子目录总访问次数的百分比。
  • 退出率:为从该页面跳出网站的浏览量的次数占该页面为下游带去所有浏览量的比
  • 平均停留时长&平均访问时长&平均访问页数&上次访问时间
  • 新访客数:访客中历史第一次访问网站的访客数
  • ip数和uv数不一致:在网吧或者学校等地,是共用一个IP上网的,但是实际访客数并不唯一,就可能出现IP数小于访客数;一般家庭电脑大多用ADSL拨号上网,也就是动态的IP 地址,一天可能拨好几次,但是实际访客数唯一,便会出现IP数大于uv数
  • 抵达率: 访问某网站的抵达率=访问次数/点击次数。抵达率过低,则说明较多点击未能抵达网站,需要查看网站url是否正常打开,速度是否够快。
百度统计的基友
  • 百度指数:以百度网页搜索和百度新闻搜索为基础的免费海量数据分析服务,用以反映不同关键词在过去一段时间里的“用户关注度”和“媒体关注度”。您可以发现、共享和挖掘互联网上最有价值的信息和资讯,直接、客观地反映社会热点、网民的兴趣和需求。
  • 百度推广:向企业提供的 按效果付费‍ 的网络营销服务,借助百度超过 80%‍ 中国搜索引擎市场份额和 60万家 联盟网站,打造了链接亿万网民和企业的供需平台,让有需求的人最便捷地找到适合自己的产品和服务,也让企业用少量投入就可以获得大量潜在客户、有效提升企业品牌影响力。
可借鉴的关键点
  • 维度分的比较细,可以得到更好的数据挖掘与分析
  1. 操作系统
  2. 地域分布
  3. 浏览器分布&搜索词分布
  4. 搜索引擎分布
  5. 其他来源分布(如直接访问、站内来源、其他网站)
  6. 屏幕分辨率分布
  7. 按小时/天/周/月分布
  8. 是否支持COOKIE
  9. 是否支持JAVA
  10. 网络服务提供商
  11. 语言环境
  • 一次访问(Session)的定义
访客在您网站上的会话(Session)次数,一次会话会浏览一个或多个页面。在百度统计里,以下三种情况会记为新的访问:

  1. 访客关闭浏览器后重新进入您的网站;
  2. 访客不关闭浏览器,但是在您网站上不活动超过30分钟,30分钟后访客再次点击您网站上的链接;
  3. 访客任何时候从其他网站到达您的网站。

就是某个页面在一次会话中被多次访问,只会计算一次pv。
  • 趋势分析
一段时间内您网站的整体流量及转化情况,您也可以选择地域与来源组合查询细分来源的流量数据
  • 最后一页的关闭时间的计算方法
  1. 用户一次访问中只访问了一个页面而该页面的关闭时间未收到,则系统赋予该页面一定定值作为访问时长;
  2. 用户一次访问中涉及到n(n≥2)个页面,其中第n个页面的关闭时间无法收到,则系统将前 (n-1)个页面的平均访问时长作为第n个页面的访问时长。

以上调整会使得平均访问时长较原来有一定程度的下降,却更符合用户真实访问行为。
简单总结
百度统计所提供的多种图形化报表还是不错的,虽然有些flash让我不爽:)
有很多有意思的定义值得借鉴和学习,如页面关闭时间的计算方法、pv计算的方法。
后续ASAE平台会借鉴其经验,如趋势分析、访问深度分析等等。
有人问我数据分析有什么用,我会告诉他:“不能起死回生,可能锦上添花”。

转载于:https://www.cnblogs.com/Darren_code/p/baidutongji.html

数据工作-百度统计初体验相关推荐

  1. php写的代码点击提交没效果,PHP代码实现提交虚假数据给百度统计

    重要:本文最后更新于2019-06-12 08:41:56,某些文章具有时效性,若有错误或已失效,请在下方留言或联系代码狗. 勾起我搞这个的兴趣是因为有个卖软件的,老是向我的百度统计后台推送引流软件广 ...

  2. Django数据库ORM模型使用(数据查询)!!!Django数据库如何使用ORM模型查询数据? ✧*。٩(ˊᗜˋ*)و✧*。 Django初体验

    文章目录 查询方法 查看执行的SQL语句 查询条件 精准与模糊查询 比较条件 时间条件 聚合函数 Avg:求平均值. Count:获取指定的对象的个数. Max和Min:获取指定对象的最大值和最小值. ...

  3. Django中的表单如何使用? Django如何验证前端发来的数据? ✧*。٩(ˊᗜˋ*)و✧*。 Django初体验

    文章目录 前期准备 前端准备 表单基础使用 创建表单 表单类型 Field CharField(Field) IntergerField(Field)与 FloatField(Filed) Decim ...

  4. php代码实现关键词搜索,PHP代码实现百度统计关键词及来路推送

    搜索热词 勾起我搞这个的兴趣是因为有个卖软件的,老是向我的百度统计后台推送引流软件广告.搜索后发现早就有人做过这方面的研究,然而随着统计代码版本升级,部分功能暂时还未解决.今天这篇 PHP 代码实现提 ...

  5. BDL 百度研究院大数据实验室的吴海山,做一名数据科学家有怎样的体验,问我吧!

    我是百度研究院大数据实验室的吴海山,做一名数据科学家有怎样的体验,问我吧! 思想 2015-06-16 已关闭提问 如果说"大数据"是一扇门,使人们得以更深入地认识这个世界和世界上 ...

  6. 【ERNIE Bot】百度 | 文心一言初体验

    文章目录 一.前言 二.文心一言介绍 三.申请体验⌈文心一言⌋ 四.⌈文心一言⌋初体验 1️⃣聊天对话能力 2️⃣文案创作能力 3️⃣文字转语音能力✨ 4️⃣AI绘画能力✨ 5️⃣数理推理能力 6️⃣ ...

  7. [LBS学习笔记 1]高德数据可视化初体验

    高德数据可视化初体验 背景 换了新工作,虽然还是java开发,但是之前搞做在线教育的,现在做地图相关的事.因此,花了些时间学了空间索引相关的内容,后期会写关于空间索引相关的内容,这期写地理数据可视化相 ...

  8. Spark系列-初体验(数据准备篇)

    Spark系列-初体验(数据准备篇) Spark系列-核心概念 在Spark体验开始前需要准备环境和数据,环境的准备可以自己按照Spark官方文档安装.笔者选择使用CDH集群安装,可以参考笔者之前的文 ...

  9. 企业管理系统原型、HRM、工作报告统计、0A、商机、合同、客户管理、产品管理、企业oa、行政办公系统、数据报表、销售分析、客户分析、产品管理、人力资源管理系统、crm、axure原型、rp源文件

    企业管理系统原型.HRM.CRM.工作报告统计.0A.商机.合同.客户管理.产品管理.企业oa.行政办公系统.数据报表.销售分析.客户分析.产品管理.人力资源管理系统.crm客户管理.axure原型. ...

最新文章

  1. php多维数组和对象,在PHP中将多维多对象数组转换为标准多维数组
  2. 如何配置三层交换机创建VLAN 2
  3. mysql删除没有索引页_InnoDB中没有主键是如何运转的
  4. SQL Server 查询数据库里所有表的行数
  5. c++ console 取实时输入_灵活使用 console 让 js 调试更简单
  6. 【物联网开发实战】- 设备上云方案详解?
  7. Arduino抢答器
  8. 基于prometheus的监控解决方案
  9. EIGRP MD5认证实例
  10. 虚拟主机网站搬到服务器上,如何把网页文件放到云虚拟主机
  11. IBM Rhapsody 报错找不到 VC11 目录的解决方法
  12. selenium chromedriver 下载地址
  13. pytorch的两个函数 .detach() .detach_() 的作用和区别
  14. Ubuntu gbd调试
  15. Matlab如何绘制小提琴图?
  16. docker 镜像瘦身工具 docker-slim
  17. 孢子社群:今日推荐ARVR微信群:游乐VR智能
  18. 10.Atomic-原子性操作
  19. RibbonGatewayopenFeign
  20. 横岗无线充android,3线圈无线充电方案

热门文章

  1. Rust 编程语言曝高危漏洞,可导致文件和目录遭删除
  2. 西门子修复热门 CAD 库中的多个代码执行高危漏洞
  3. 美国Hack the Army 3.0 漏洞奖励计划启动
  4. FireEye红队失窃工具大揭秘之:分析复现Zoho ManageEngine RCE (CVE-2020-10189)
  5. 前脚修复,后脚放 PoC:马上修复这个严重的SAP Recon 漏洞!
  6. 支撑Java NIO 与 NodeJS的底层技术
  7. 百度Map与HT for Web结合的GIS网络拓扑应用
  8. rhel5 下cacti安装日志
  9. Linux定时任务Crontab详解
  10. 编译在arm版本的Valgrind-转