论坛为有相同爱好的网友提供了广阔的互动交流平台,而由此积累下来的庞大数据和复杂的用户互动场景也蕴含着有价值的信息,本文对虎扑论坛的帖子、个人信息展开分析,探索虎扑论坛用户有哪些特点?

tecdat研究人员对2018年1月份的虎扑论坛步行街各子版块的所有帖子进行分析,用数据探索用户行为,同时勾勒用户偏好。

以下是摘自虎扑的官方介绍:虎扑是为年轻男性服务的专业网站,涵盖篮球、足球、F1、NFL等赛事的原创新闻专栏视频报道,拥有大型的生活/影视/电竞/汽车/数码网上交流社区,聊体育谈兴趣尽在虎扑。

数据说明

数据来源:

2018年1月份虎扑论坛步行街各子版块的所有帖子,去除关注度极低的帖子,总数为3.3W+;

上述3.3W+篇帖子中主干道版块的回复用户的个人信息,去重后用户总数为2.3W+。

社交和交易属性是活跃度关键

在虎扑社区由10个分论坛,380个子版块构成,日发帖量达到70W+,其中哪一个最活跃呢?

通过对比每个版块发帖量,可以发现,在大的分论坛中 【装备论坛】的发帖量最高,其次是【步行街】和【NBA】;在380个子板块中,【步行街主干道】和【IT数码】最热门,其次是【车友交流】和【爆照区】;其中,【步行街】的发帖占比近7成,远高于其他。

可以看出,交易属性和社交属性是虎扑维持社区热度和用户的活跃度的关键。

除了体育,交友八卦是最关心的话题

除了交易版块,【步行街】和【NBA】是虎扑活跃度最高的版块,【NBA论坛】的话题一般围绕赛事展开,而【步行街】的社交属性比较强,通过对【步行街】的分析,可以看到在体育赛事之余,虎扑的会员都在关注些什么。

通过对所有步行街版块的帖子内容进行词云分析,取出提及次数高于50的高频词,可以得到如下的词云图。从词云图中可以看出,步行街版块的讨论内容与“女朋友” “朋友”“喜欢”等情感关键词提及频次非常高,可以推断虎扑社区的会员以年轻男性为主;

贝弗利,运动,篮球关键词也被频繁提及,可见虎扑会员的体育属性较强;同时,我们还可以看到,词云中还包括李小璐,特步等关键词,可见大家对八卦热点和知乎热榜上的话题也非常关注;

另外,“大学”,“室友”,“毕业”等也频频被提及,可见虎扑社区活跃着一批在校大学生。

综上所述,我们可以初步猜测,虎扑会员以年轻的男性和在校大学生为主,他们喜欢篮球等体育运动,交友是他们最关心的话题,同时他们还喜欢讨论一些八卦热点和知乎微博等热门话题。

用户分析

用户性别

排除不愿意透露性别的用户,剩下的步行街活跃用户中,女性仅占4.5%,这和虎扑体育社区的属性基本一致。

用户所在地

从下面的地域分布图可以看到,步行街的活跃用户主要分布在广东,江苏,北京,浙江,上海等经济发达的省市,上述五个地区合计占比超过5成;

用户日停留时长

通过计算用户注册天数以及在线时长,可以发现,虽然45.5%的用户日均使用时间在半小时以内,但同时3成以上的用户日停留时长达到1小时以上,说明虎扑社团提供的内容有较强的吸引力。

总结

总体上看,虎扑会员以年轻的男性和在校大学生为主,他们喜欢篮球等体育运动,关注NBA,英超等球类联赛;但在步行街社区,他们的话题不仅限于体育,八卦热点,情感咨询等都是他们关注的内容;并且他们每天在虎扑停留时间较长,可以说虎扑的内容很好的抓住了目前的用户群体。

▍关注我们

趋势报告、案例精选、最新洞察 第一时间与您分享

【拓端数据】第三方数据服务提供商,提供全面的统计分析与数据挖掘咨询服务,为客户定制个性化的数据解决方案与行业报告等。

官网: tecdat.cn

微信公众号:拓端数据

转载于:https://www.cnblogs.com/tecdat/p/9284540.html

(转)虎扑论坛基因探秘:社群用户行为数据洞察相关推荐

  1. 虎扑论坛爬虫采集数据可视化分析

    原文链接:http://tecdat.cn/?p=2018 论坛为用户提供了相同的业余爱好,互动和交流的广阔平台,以及由此产生的庞大数据和复杂的用户交互场景也包含有价值的信息,本文关于虎扑论坛的帖子, ...

  2. 虎扑论坛用户数据分析报告

    原文:http://tecdat.cn/?p=4115 一.以下是摘自虎扑的官方介绍: 虎扑是为年轻男性服务的专业网站,涵盖篮球.足球.F1.NFL等赛事的原创新闻专栏视频报道,拥有大型的生活/影视/ ...

  3. 【Python爬虫】MongoDB爬虫实践:爬取虎扑论坛

    MongoDB爬虫实践:爬取虎扑论坛 网站地址为:https://bbs.hupu.com/bxj 1.网站分析 首先,定位网页上帖子名称.帖子链接.作者.作者链接.创建时间.回复数目.浏览数目.最后 ...

  4. python爬取虎扑论坛帖子数据

    前言 本文的文字及图片来源于网络,仅供学习.交流使用,不具有任何商业用途,如有问题请及时联系我们以作处理. PS:如有需要Python学习资料的小伙伴可以加点击下方链接自行获取 python免费学习资 ...

  5. scrapy框架爬取虎扑论坛球队新闻

    目录 Scrapy 框架 制作 Scrapy 爬虫 一共需要4步: Scrapy的安装介绍 Windows 安装方式 一. 新建项目(scrapy startproject) 二.明确目标(mySpi ...

  6. python3论坛_Python3 爬虫实战 — 虎扑论坛步行街

    爬取时间:2019-10-12 爬取难度:★★☆☆☆☆ 请求链接:https://bbs.hupu.com/bxj 爬取目标:爬取虎扑论坛步行街的帖子,包含主题,作者,发布时间等,数据保存到 Mong ...

  7. Python3 爬虫实战 — 虎扑论坛步行街【requests、Beautiful Soup、MongoDB】

    爬取时间:2019-10-12 爬取难度:★★☆☆☆☆ 请求链接:https://bbs.hupu.com/bxj 爬取目标:爬取虎扑论坛步行街的帖子,包含主题,作者,发布时间等,数据保存到 Mong ...

  8. 爬虫入门实践之爬取虎扑论坛帖子

    现在网络以及移动互联网发展迅速,大家花费越来越多的时间逛一些网站浏览帖子,比如贴吧.论坛等.博主喜欢打篮球,爱看NBA,因此常常行迹于虎扑论坛,看一些精彩赛事以及比较好的帖子.本文主要通过对虎扑某一版 ...

  9. [python 爬虫]Python爬虫抓取虎扑论坛帖子图片

    自从可以实现抓取文字了,自然要尝试更多的类型,比如图片.我是一个有逛虎扑论坛习惯的人,经常会发现有些帖子的图片挺好看的想保存下来,但是如果人为保存的话,一个帖子至少都有二三十张,这将是一个庞大的工作量 ...

最新文章

  1. 返回txt格式的文本使用编码 js_Node.js学习笔记第一天
  2. c+和python先学哪个比较好-python和c,应该先学哪个?
  3. extjs学习(关于grid)
  4. 招商局集团内部控制手册pdf_企业内部控制流程手册,全文22模块,内容很全面,可直接打印使用...
  5. debian查询端口进程_Linux查看端口、进程情况及kill进程
  6. linux c 日志写入文件,linux下C语言实现写日志功能
  7. mysql 联表删除limit_sql连表删除 | 深蓝的blog
  8. PPT:动画出现设置
  9. java学习笔记(10) 第10 章(上) - 面向对象编程(高级部分)
  10. 网络安全技术及应用--网络安全基础(第一章)
  11. Error while extracting response for type [class xxx] and content type application/xml;charset=UTF-8
  12. 微信小程序与公众号区别PHP,微信小程序和微信公众号的区别是什么?
  13. 2022年总结:道阻且长,行则将至
  14. (全)Word Embedding
  15. 常见数据结构和算法实现(排序/查找/数组/链表/栈/队列/树/递归/海量数据处理/图/位图/Java版数据结构)
  16. Oracle数据库应用
  17. 无论你想发展的方向是什么,关注这些总没错!
  18. 打卡leetcode第12天
  19. 相比传统垂直摄影测量,倾斜摄影测量的独特优势是什么?
  20. 建筑设计用计算机要求高吗,建筑设计电脑怎么选?高配置性能是关键

热门文章

  1. input限制只能11位的数字电话号码
  2. 找素数模板:马氏筛法【复杂度nlgnlgn】
  3. [SARscape] 多时相SAR影像的应用 - 监督分类、提取水稻种植区 - 以Sentinel-1A数据为例
  4. layer.open打不开弹窗的问题
  5. vue中Echarts地图组件+城市json文件
  6. java8 GC日志分析
  7. NOI的1.9.8白细胞计数
  8. AUTOCAD——JOIN合并命令
  9. 朴素贝叶斯的概念简介
  10. 学习书籍与视频的选择