拓端tecdat|爬取微博用户行为数据语义分析数据挖掘报告
原文链接:http://tecdat.cn/?p=2085
原文出处:拓端数据部落公众号
微博作为热门话题的聚集地,评价、点赞转发、评论有无水军……都可能影响新人们的判断。本文对婚策微博上的用户行为数据进行盘点,一起来看看微博用户行为里有哪些值得深挖的奥秘吧!
▼
每年的“五一”前后都是新人结婚的扎堆期。随着结婚旺季到来,如何办一场终身难忘的婚宴成为人们的热门话题。微博作为热门话题的聚集地,评价、点赞转发、评论有无水军……都可能影响新人们的判断。
有鉴于此,tecdat研究人员对婚策微博上的用户行为数据进行盘点,结合语义分析,定位用户的互动情况,以此来提炼有价值的信息。
互动分析 :用户最关注婚礼品牌和案例
本次分析我们采集共计13585条微博,678295条关键词以及每个微博对应的点赞,转发,评论。
并分别配置权重:转发0.5,评论0.3,点赞0.2。计算加权值(记做互动分)。依据:权重公司内部应用使用的加权算法。
展示
为了方便衡量互动程度,我们定义:互动分值小于等于最低的25%互动级别记为low(差),50%-75%的互动分互动级别记为high(较好),>=75%的互动分:互动级别记为max(优秀)。
展示
活跃度最高的词汇是 “婚礼”
活跃度高的词汇都和公司名字紧密相关:营销号好百年婚礼一共4967条微博,好百年出现了1090次千百合一共2718条微博,千百合出现1090次银禧婚礼策划公司 一共1754条微博,仅高互动关键词里银禧现了516次,以上数据还仅仅是高互动微博的数据分布情况。
关键词关于婚礼策划案例相关的微博,用户活跃度高(即:非僵尸粉的有效用户多)
场景细分:内容,描述,色彩
然后我们选取关于活动策划方面的高活跃词,进行词频分布分析。选取关于互动级别为max的策划相关关键词:
1. “婚礼”互动评分3717660,占5.07%,高居榜首;
2. “转发”互动评分2799078,占3.82%;
3. “酒店”互动占2.71%。
婚庆账号在微博推广,围绕“婚礼”为主题频繁举办“转发”“抽奖”活动。根据微博活跃分的数据看。这种方式在综合转发、评论、点赞上看,效果最佳。
有利于客户直观地了解微博文章主题,利用转发抽奖,触发潜在客户活跃、吸引眼球,有利于提高微博账号曝光度。
展示
选取关于互动级别为max的内容属性相关关键词:
微博内容中多以展示案例图片为主,主要介绍婚礼举办“酒店”,婚礼涉及“品牌”,婚礼“摄影摄像”等,多以图片为主。
选取关于互动级别为max的案例相关关键词:
用户最喜欢带有高级属性的案例,红蓝金紫粉的颜色最受用户喜欢。
拓端tecdat|爬取微博用户行为数据语义分析数据挖掘报告相关推荐
- 爬取微博用户行为数据语义分析数据挖掘报告
原文链接:http://tecdat.cn/?p=2085 微博作为热门话题的聚集地,评价.点赞转发.评论有无水军--都可能影响新人们的判断.本文对婚策微博上的用户行为数据进行盘点,一起来看看微博用户 ...
- 基于golang的爬虫demo,爬取微博用户的粉丝和关注者信息
基于golang的爬虫demo,爬取微博用户的粉丝和关注者信息 注意:仅供学习交流,任何非法使用与作者无关! 目录 基于golang的爬虫demo,爬取微博用户的粉丝和关注者信息 一.背景与取材 二. ...
- python微博爬虫实战_爬虫实战(一):爬取微博用户信息
前言 最近做课设,是一个有关个人隐私安全的课题,在网上找了很多论文,最后上海交通大学的一篇硕士论文<面向社会工程学的SNS分析和挖掘>[1] 给了我很多灵感,因为是对个人隐私安全进行评估, ...
- python爬取微博用户信息(六)—— 完整代码
本节为爬取微博用户信息的完整代码,以及项目结构. 感兴趣的小伙伴可以收藏哦! 另外,关于本代码的效果展示,以及教程,点击以下链接即可. python爬取微博用户信息(一)-- 效果展示 python爬 ...
- python爬取微博用户信息(四)—— 爬取用户信息的功能函数
这一节,将会将 MicroBlog.py 文件中的函数介绍一下. 感兴趣的小伙伴可以收藏哦! 另外,关于本代码的效果展示,以及教程,点击以下链接即可. python爬取微博用户信息(一)-- 效果展示 ...
- python爬取微博用户信息(三)—— 创建MicroBlog类实例
这一节,主要讲述 main.py文件,该文件创建了一个MicroBlog类,MicroBlog类中包含一些爬取微博内容的函数. 以及简单介绍traceback的用法. 感兴趣的小伙伴可以收藏哦! 另外 ...
- python爬取微博用户信息(一)—— 效果展示
有时,我们想要了解一个人,一般会通过ta的微博.朋友圈以及朋友的看法去了解. 特别是面对自己喜欢的明星,我们常常会浏览ta的微博,了解ta的动态. 那么,在大数据时代,数据已经成为了不可缺少的一部分, ...
- 爬虫爬取微博用户粉丝及其关注
爬虫爬取微博用户粉丝及其关注 前言 前段时间做了一个爬虫爬取微博用户粉丝及其关注的小项目,但忙着中期毕设答辩忘了加以记录了.对于动态网页的解决办法是使用selenium(上手比较快,而且抓包实 ...
- 爬虫(8)-Scrapy爬取微博用户粉丝,关注和微博内容
本文主要讲解使用scrapy爬取微博用户的关注,粉丝和微博内容. 认为有用的话请点赞,码字不易,谢谢. 其他爬虫实战请查看:https://blog.csdn.net/qq_42754919/cate ...
- Scrapy爬取新浪微博用户粉丝数据
一般来说pc端的信息是最为全面的,但是防范措施也是最严格的.所以不能走weibo.com这个域名下进行爬取,新浪微博在pc端的反扒措施较为全面.而手机端的数据则相对好爬取,而且数据都是Json格式,解 ...
最新文章
- python线程实现人脸识别_OpenCV/Python:用于实时人脸识别的多线程技术
- laya zip更新方案
- 【2018.10.20】noip模拟赛Day3 二阶和
- JS——样式类的添加
- SLAM学习--帝国理工学院机器人课程slam部分讲义(附下载链接)
- 25、UIView的setNeedsLayout, layoutIfNeeded 和 layoutSubviews 方法之间的关系解释
- android德州扑克计算器,学界 | 一台笔记本打败超算:CMU冷扑大师团队提出全新德扑AI Modicum...
- 中科大少年班目前为止出过多少大牛?
- 第 2-3 课:抽象类和接口 + 面试题
- NSURLSessionDownloadTask实现大文件下载
- 【洛谷】【treap/堆】P2073 送花
- 如何删除绿盾加密软件
- python可视化计算器_使用Python自带GUI tkinter编写一个期权价格计算器
- 小胜凭智, 大胜靠德
- @ds实现多数据源切换及解决事务失效问题
- 男人买鞋有点难——中国十大皮鞋
- SteamVR 2.x 手柄射线与3D物体交互(9)
- Spark —— 闪电般快速的统一分析引擎 —— 入门基础知识
- 屏幕点亮测试软件设计,Pixel Ruler(屏幕测量工具)
- lstm结构图_LSTM模型结构的可视化
热门文章
- ORA-03113: 通信通道的文件结尾 进程 ID: 764 会话 ID: 125 序列号: 5
- 【翻译】Geometric Features-Based Parking Slot Detection
- python reference理解
- TensorFlow读取自己数据集的几个小方法
- 数据--第34课 - 二叉树的深层性质
- 电磁场与电磁波实验:仿真计算介质板的电磁参数
- 通过OAuth方式与docker hub v2 API交互
- 20155301 Exp7 网络欺诈防范
- Android 5.0 屏幕录制/截屏
- fsck命令--Linux命令应用大词典729个命令解读