原文链接:http://tecdat.cn/?p=2085

  

  微博作为热门话题的聚集地,评价、点赞转发、评论有无水军……都可能影响新人们的判断。本文对婚策微博上的用户行为数据进行盘点,一起来看看微博用户行为里有哪些值得深挖的奥秘吧!

  ▼

  每年的“五一”前后都是新人结婚的扎堆期。随着结婚旺季到来,如何办一场终身难忘的婚宴成为人们的热门话题。微博作为热门话题的聚集地,评价、点赞转发、评论有无水军……都可能影响新人们的判断。

  有鉴于此,tecdat研究人员对婚策微博上的用户行为数据进行盘点,结合语义分析,定位用户的互动情况,以此来提炼有价值的信息。

  互动分析 :用户最关注婚礼品牌和案例

  本次分析我们采集共计13585条微博,678295条关键词以及每个微博对应的点赞,转发,评论。

  并分别配置权重:转发0.5,评论0.3,点赞0.2。计算加权值(记做互动分)。依据:权重公司内部应用使用的加权算法。

  展示

  

  为了方便衡量互动程度,我们定义:互动分值小于等于最低的25%互动级别记为low(差),50%-75%的互动分互动级别记为high(较好),>=75%的互动分:互动级别记为max(优秀)。

  展示

  

  活跃度最高的词汇是 “婚礼”

  活跃度高的词汇都和公司名字紧密相关:营销号好百年婚礼一共4967条微博,好百年出现了1090次千百合一共2718条微博,千百合出现1090次银禧婚礼策划公司 一共1754条微博,仅高互动关键词里银禧现了516次,以上数据还仅仅是高互动微博的数据分布情况。

  关键词关于婚礼策划案例相关的微博,用户活跃度高(即:非僵尸粉的有效用户多)

  场景细分:内容,描述,色彩

  然后我们选取关于活动策划方面的高活跃词,进行词频分布分析。选取关于互动级别为max的策划相关关键词:

  1. “婚礼”互动评分3717660,占5.07%,高居榜首;

  2. “转发”互动评分2799078,占3.82%;

  3. “酒店”互动占2.71%。

  婚庆账号在微博推广,围绕“婚礼”为主题频繁举办“转发”“抽奖”活动。根据微博活跃分的数据看。这种方式在综合转发、评论、点赞上看,效果最佳。

  有利于客户直观地了解微博文章主题,利用转发抽奖,触发潜在客户活跃、吸引眼球,有利于提高微博账号曝光度。

  展示

  

  选取关于互动级别为max的内容属性相关关键词:

  微博内容中多以展示案例图片为主,主要介绍婚礼举办“酒店”,婚礼涉及“品牌”,婚礼“摄影摄像”等,多以图片为主。

  选取关于互动级别为max的案例相关关键词:

  用户最喜欢带有高级属性的案例,红蓝金紫粉的颜色最受用户喜欢。

点击标题查阅往期内容

婚庆市场用户行为数据采集爬虫分析报告(以小红书为例)

互联网热门职位薪资数据采集爬虫对比报告

scrapy爬虫框架和selenium的使用:对优惠券推荐网站数据LDA文本挖掘

亚马逊商品销售数据爬虫分析报告

python爬虫进行Web抓取LDA主题语义数据分析报告

R语言文本主题模型之潜在语义分析(LDA:Latent Dirichlet Allocation)

语义分析智能门锁评价数据

用R对Twitter用户的编程语言语义分析

爬取微博用户行为数据语义分析数据挖掘报告

更多内容,请点击左下角“阅读原文”查看报告全文

关注我们

案例精选、技术干货 第一时间与您分享

长按二维码加关注

更多内容,请点击左下角“阅读原文”查看报告全文

爬取微博用户行为数据语义分析数据挖掘报告相关推荐

  1. 基于golang的爬虫demo,爬取微博用户的粉丝和关注者信息

    基于golang的爬虫demo,爬取微博用户的粉丝和关注者信息 注意:仅供学习交流,任何非法使用与作者无关! 目录 基于golang的爬虫demo,爬取微博用户的粉丝和关注者信息 一.背景与取材 二. ...

  2. python微博爬虫实战_爬虫实战(一):爬取微博用户信息

    前言 最近做课设,是一个有关个人隐私安全的课题,在网上找了很多论文,最后上海交通大学的一篇硕士论文<面向社会工程学的SNS分析和挖掘>[1] 给了我很多灵感,因为是对个人隐私安全进行评估, ...

  3. Scrapy爬取新浪微博用户粉丝数据

    一般来说pc端的信息是最为全面的,但是防范措施也是最严格的.所以不能走weibo.com这个域名下进行爬取,新浪微博在pc端的反扒措施较为全面.而手机端的数据则相对好爬取,而且数据都是Json格式,解 ...

  4. python爬取微博用户信息(一)—— 效果展示

    有时,我们想要了解一个人,一般会通过ta的微博.朋友圈以及朋友的看法去了解. 特别是面对自己喜欢的明星,我们常常会浏览ta的微博,了解ta的动态. 那么,在大数据时代,数据已经成为了不可缺少的一部分, ...

  5. 爬虫爬取微博用户粉丝及其关注

    爬虫爬取微博用户粉丝及其关注 前言 ​ ​ 前段时间做了一个爬虫爬取微博用户粉丝及其关注的小项目,但忙着中期毕设答辩忘了加以记录了.对于动态网页的解决办法是使用selenium(上手比较快,而且抓包实 ...

  6. python爬取微博热搜数据并保存!

    主要用到requests和bf4两个库将获得的信息保存在d://hotsearch.txt下importrequests;importbs4mylist=[]r=requests.get(ur- 很多 ...

  7. python爬取微博用户信息(六)—— 完整代码

    本节为爬取微博用户信息的完整代码,以及项目结构. 感兴趣的小伙伴可以收藏哦! 另外,关于本代码的效果展示,以及教程,点击以下链接即可. python爬取微博用户信息(一)-- 效果展示 python爬 ...

  8. python爬取微博用户信息(四)—— 爬取用户信息的功能函数

    这一节,将会将 MicroBlog.py 文件中的函数介绍一下. 感兴趣的小伙伴可以收藏哦! 另外,关于本代码的效果展示,以及教程,点击以下链接即可. python爬取微博用户信息(一)-- 效果展示 ...

  9. python爬取微博用户信息(三)—— 创建MicroBlog类实例

    这一节,主要讲述 main.py文件,该文件创建了一个MicroBlog类,MicroBlog类中包含一些爬取微博内容的函数. 以及简单介绍traceback的用法. 感兴趣的小伙伴可以收藏哦! 另外 ...

最新文章

  1. php实现小说字典功能_PHP实现获取并生成数据库字典的方法
  2. 1056 Mice and Rice (25 分)【难度: 一般 / 知识点: 模拟】
  3. element ui登录界面_Vue和Element-UI做一个简单的登录页面
  4. linux网络编程之字节序
  5. 计算机图形学论文_论图计算
  6. 开关量光端机指示灯说明及常见故障问题处理方法
  7. 淘宝CSV每个字段的数据容量原来有限制的
  8. w3cschool php 调整图片尺寸,PHP_php修改上传图片尺寸的方法,本文实例讲述了php修改上传图 - phpStudy...
  9. oracle 31640,导数据时ora-31640报错
  10. linux perl 安装目录,linux-将Perl模块安装到特定位置
  11. 西南大学校园GIS平台
  12. 【Oracle】ORA-01157: cannot identify/lock data file 201 - see DBWR trace file
  13. mysql 数据库军规_用尽洪荒之力整理的Mysql数据库32条军规(转)
  14. UOJ #357. 【JOI2017春季合宿】Sparklers
  15. eclipse 环境安装
  16. 微服务网关Gateway在实战中如何结合注册中心,定义过滤器?
  17. Web基础(Java前端基础)
  18. A Pixel-Wise Distance Regression Approach for Joint Retinal Optical Disc and Fovea Detection
  19. matlab 电路频率响应_频率响应法与matlab指令计算
  20. 王家林 构建spark集群

热门文章

  1. python之类的构造方法
  2. 微信小程序笔记(三)Wepy使用记录—Stylus预编译基本使用
  3. Redis分布式缓存应用:主从复制master-slave,yum.安装报错Loading mirror speeds from cached hostfile 错误:M传递S成为M递归,薪火相传
  4. 浅谈Base64编码
  5. 查询网站的服务器,查询网站服务器
  6. 【编程素质】设计模式原则(SOLID原则)
  7. 离散傅里叶变换(DFT)(一)
  8. Java基础(八)---- if判断语句
  9. 鸿蒙和ios兼容吗,和安卓、iOS有何区别?一文看懂鸿蒙手机操作系统
  10. QT环境中 _TCHAR 和 QString 互相转换