原文链接:http://tecdat.cn/?p=2085

原文出处:拓端数据部落公众号

  

  

  微博作为热门话题的聚集地,评价、点赞转发、评论有无水军……都可能影响新人们的判断。本文对婚策微博上的用户行为数据进行盘点,一起来看看微博用户行为里有哪些值得深挖的奥秘吧!

  

  ▼

  每年的“五一”前后都是新人结婚的扎堆期。随着结婚旺季到来,如何办一场终身难忘的婚宴成为人们的热门话题。微博作为热门话题的聚集地,评价、点赞转发、评论有无水军……都可能影响新人们的判断。

  有鉴于此,tecdat研究人员对婚策微博上的用户行为数据进行盘点,结合语义分析,定位用户的互动情况,以此来提炼有价值的信息。

  互动分析 :用户最关注婚礼品牌和案例

  本次分析我们采集共计13585条微博,678295条关键词以及每个微博对应的点赞,转发,评论。

  并分别配置权重:转发0.5,评论0.3,点赞0.2。计算加权值(记做互动分)。依据:权重公司内部应用使用的加权算法。

  展示

  

  为了方便衡量互动程度,我们定义:互动分值小于等于最低的25%互动级别记为low(差),50%-75%的互动分互动级别记为high(较好),>=75%的互动分:互动级别记为max(优秀)。

  展示

  

  活跃度最高的词汇是 “婚礼”

  活跃度高的词汇都和公司名字紧密相关:营销号好百年婚礼一共4967条微博,好百年出现了1090次千百合一共2718条微博,千百合出现1090次银禧婚礼策划公司 一共1754条微博,仅高互动关键词里银禧现了516次,以上数据还仅仅是高互动微博的数据分布情况。

  关键词关于婚礼策划案例相关的微博,用户活跃度高(即:非僵尸粉的有效用户多)

  场景细分:内容,描述,色彩

  然后我们选取关于活动策划方面的高活跃词,进行词频分布分析。选取关于互动级别为max的策划相关关键词:

  1. “婚礼”互动评分3717660,占5.07%,高居榜首;

  2. “转发”互动评分2799078,占3.82%;

  3. “酒店”互动占2.71%。

  婚庆账号在微博推广,围绕“婚礼”为主题频繁举办“转发”“抽奖”活动。根据微博活跃分的数据看。这种方式在综合转发、评论、点赞上看,效果最佳。

  有利于客户直观地了解微博文章主题,利用转发抽奖,触发潜在客户活跃、吸引眼球,有利于提高微博账号曝光度。

  展示

  

  选取关于互动级别为max的内容属性相关关键词:

  微博内容中多以展示案例图片为主,主要介绍婚礼举办“酒店”,婚礼涉及“品牌”,婚礼“摄影摄像”等,多以图片为主。

  选取关于互动级别为max的案例相关关键词:

  用户最喜欢带有高级属性的案例,红蓝金紫粉的颜色最受用户喜欢。

拓端tecdat|爬取微博用户行为数据语义分析数据挖掘报告相关推荐

  1. 爬取微博用户行为数据语义分析数据挖掘报告

    原文链接:http://tecdat.cn/?p=2085 微博作为热门话题的聚集地,评价.点赞转发.评论有无水军--都可能影响新人们的判断.本文对婚策微博上的用户行为数据进行盘点,一起来看看微博用户 ...

  2. 基于golang的爬虫demo,爬取微博用户的粉丝和关注者信息

    基于golang的爬虫demo,爬取微博用户的粉丝和关注者信息 注意:仅供学习交流,任何非法使用与作者无关! 目录 基于golang的爬虫demo,爬取微博用户的粉丝和关注者信息 一.背景与取材 二. ...

  3. python微博爬虫实战_爬虫实战(一):爬取微博用户信息

    前言 最近做课设,是一个有关个人隐私安全的课题,在网上找了很多论文,最后上海交通大学的一篇硕士论文<面向社会工程学的SNS分析和挖掘>[1] 给了我很多灵感,因为是对个人隐私安全进行评估, ...

  4. python爬取微博用户信息(六)—— 完整代码

    本节为爬取微博用户信息的完整代码,以及项目结构. 感兴趣的小伙伴可以收藏哦! 另外,关于本代码的效果展示,以及教程,点击以下链接即可. python爬取微博用户信息(一)-- 效果展示 python爬 ...

  5. python爬取微博用户信息(四)—— 爬取用户信息的功能函数

    这一节,将会将 MicroBlog.py 文件中的函数介绍一下. 感兴趣的小伙伴可以收藏哦! 另外,关于本代码的效果展示,以及教程,点击以下链接即可. python爬取微博用户信息(一)-- 效果展示 ...

  6. python爬取微博用户信息(三)—— 创建MicroBlog类实例

    这一节,主要讲述 main.py文件,该文件创建了一个MicroBlog类,MicroBlog类中包含一些爬取微博内容的函数. 以及简单介绍traceback的用法. 感兴趣的小伙伴可以收藏哦! 另外 ...

  7. python爬取微博用户信息(一)—— 效果展示

    有时,我们想要了解一个人,一般会通过ta的微博.朋友圈以及朋友的看法去了解. 特别是面对自己喜欢的明星,我们常常会浏览ta的微博,了解ta的动态. 那么,在大数据时代,数据已经成为了不可缺少的一部分, ...

  8. 爬虫爬取微博用户粉丝及其关注

    爬虫爬取微博用户粉丝及其关注 前言 ​ ​ 前段时间做了一个爬虫爬取微博用户粉丝及其关注的小项目,但忙着中期毕设答辩忘了加以记录了.对于动态网页的解决办法是使用selenium(上手比较快,而且抓包实 ...

  9. 爬虫(8)-Scrapy爬取微博用户粉丝,关注和微博内容

    本文主要讲解使用scrapy爬取微博用户的关注,粉丝和微博内容. 认为有用的话请点赞,码字不易,谢谢. 其他爬虫实战请查看:https://blog.csdn.net/qq_42754919/cate ...

  10. Scrapy爬取新浪微博用户粉丝数据

    一般来说pc端的信息是最为全面的,但是防范措施也是最严格的.所以不能走weibo.com这个域名下进行爬取,新浪微博在pc端的反扒措施较为全面.而手机端的数据则相对好爬取,而且数据都是Json格式,解 ...

最新文章

  1. python线程实现人脸识别_OpenCV/Python:用于实时人脸识别的多线程技术
  2. laya zip更新方案
  3. 【2018.10.20】noip模拟赛Day3 二阶和
  4. JS——样式类的添加
  5. SLAM学习--帝国理工学院机器人课程slam部分讲义(附下载链接)
  6. 25、UIView的setNeedsLayout, layoutIfNeeded 和 layoutSubviews 方法之间的关系解释
  7. android德州扑克计算器,学界 | 一台笔记本打败超算:CMU冷扑大师团队提出全新德扑AI Modicum...
  8. 中科大少年班目前为止出过多少大牛?
  9. 第 2-3 课:抽象类和接口 + 面试题
  10. NSURLSessionDownloadTask实现大文件下载
  11. 【洛谷】【treap/堆】P2073 送花
  12. 如何删除绿盾加密软件
  13. python可视化计算器_使用Python自带GUI tkinter编写一个期权价格计算器
  14. 小胜凭智, 大胜靠德
  15. @ds实现多数据源切换及解决事务失效问题
  16. 男人买鞋有点难——中国十大皮鞋
  17. SteamVR 2.x 手柄射线与3D物体交互(9)
  18. Spark —— 闪电般快速的统一分析引擎 —— 入门基础知识
  19. 屏幕点亮测试软件设计,Pixel Ruler(屏幕测量工具)
  20. lstm结构图_LSTM模型结构的可视化

热门文章

  1. ORA-03113: 通信通道的文件结尾 进程 ID: 764 会话 ID: 125 序列号: 5
  2. 【翻译】Geometric Features-Based Parking Slot Detection
  3. python reference理解
  4. TensorFlow读取自己数据集的几个小方法
  5. 数据--第34课 - 二叉树的深层性质
  6. 电磁场与电磁波实验:仿真计算介质板的电磁参数
  7. 通过OAuth方式与docker hub v2 API交互
  8. 20155301 Exp7 网络欺诈防范
  9. Android 5.0 屏幕录制/截屏
  10. fsck命令--Linux命令应用大词典729个命令解读