爬取微博用户行为数据语义分析数据挖掘报告
原文链接:http://tecdat.cn/?p=2085
微博作为热门话题的聚集地,评价、点赞转发、评论有无水军……都可能影响新人们的判断。本文对婚策微博上的用户行为数据进行盘点,一起来看看微博用户行为里有哪些值得深挖的奥秘吧!
▼
每年的“五一”前后都是新人结婚的扎堆期。随着结婚旺季到来,如何办一场终身难忘的婚宴成为人们的热门话题。微博作为热门话题的聚集地,评价、点赞转发、评论有无水军……都可能影响新人们的判断。
有鉴于此,tecdat研究人员对婚策微博上的用户行为数据进行盘点,结合语义分析,定位用户的互动情况,以此来提炼有价值的信息。
互动分析 :用户最关注婚礼品牌和案例
本次分析我们采集共计13585条微博,678295条关键词以及每个微博对应的点赞,转发,评论。
并分别配置权重:转发0.5,评论0.3,点赞0.2。计算加权值(记做互动分)。依据:权重公司内部应用使用的加权算法。
展示
为了方便衡量互动程度,我们定义:互动分值小于等于最低的25%互动级别记为low(差),50%-75%的互动分互动级别记为high(较好),>=75%的互动分:互动级别记为max(优秀)。
展示
活跃度最高的词汇是 “婚礼”
活跃度高的词汇都和公司名字紧密相关:营销号好百年婚礼一共4967条微博,好百年出现了1090次千百合一共2718条微博,千百合出现1090次银禧婚礼策划公司 一共1754条微博,仅高互动关键词里银禧现了516次,以上数据还仅仅是高互动微博的数据分布情况。
关键词关于婚礼策划案例相关的微博,用户活跃度高(即:非僵尸粉的有效用户多)
场景细分:内容,描述,色彩
然后我们选取关于活动策划方面的高活跃词,进行词频分布分析。选取关于互动级别为max的策划相关关键词:
1. “婚礼”互动评分3717660,占5.07%,高居榜首;
2. “转发”互动评分2799078,占3.82%;
3. “酒店”互动占2.71%。
婚庆账号在微博推广,围绕“婚礼”为主题频繁举办“转发”“抽奖”活动。根据微博活跃分的数据看。这种方式在综合转发、评论、点赞上看,效果最佳。
有利于客户直观地了解微博文章主题,利用转发抽奖,触发潜在客户活跃、吸引眼球,有利于提高微博账号曝光度。
展示
选取关于互动级别为max的内容属性相关关键词:
微博内容中多以展示案例图片为主,主要介绍婚礼举办“酒店”,婚礼涉及“品牌”,婚礼“摄影摄像”等,多以图片为主。
选取关于互动级别为max的案例相关关键词:
用户最喜欢带有高级属性的案例,红蓝金紫粉的颜色最受用户喜欢。
点击标题查阅往期内容
婚庆市场用户行为数据采集爬虫分析报告(以小红书为例)
互联网热门职位薪资数据采集爬虫对比报告
scrapy爬虫框架和selenium的使用:对优惠券推荐网站数据LDA文本挖掘
亚马逊商品销售数据爬虫分析报告
python爬虫进行Web抓取LDA主题语义数据分析报告
R语言文本主题模型之潜在语义分析(LDA:Latent Dirichlet Allocation)
语义分析智能门锁评价数据
用R对Twitter用户的编程语言语义分析
爬取微博用户行为数据语义分析数据挖掘报告
更多内容,请点击左下角“阅读原文”查看报告全文
关注我们
案例精选、技术干货 第一时间与您分享
长按二维码加关注
更多内容,请点击左下角“阅读原文”查看报告全文
爬取微博用户行为数据语义分析数据挖掘报告相关推荐
- 基于golang的爬虫demo,爬取微博用户的粉丝和关注者信息
基于golang的爬虫demo,爬取微博用户的粉丝和关注者信息 注意:仅供学习交流,任何非法使用与作者无关! 目录 基于golang的爬虫demo,爬取微博用户的粉丝和关注者信息 一.背景与取材 二. ...
- python微博爬虫实战_爬虫实战(一):爬取微博用户信息
前言 最近做课设,是一个有关个人隐私安全的课题,在网上找了很多论文,最后上海交通大学的一篇硕士论文<面向社会工程学的SNS分析和挖掘>[1] 给了我很多灵感,因为是对个人隐私安全进行评估, ...
- Scrapy爬取新浪微博用户粉丝数据
一般来说pc端的信息是最为全面的,但是防范措施也是最严格的.所以不能走weibo.com这个域名下进行爬取,新浪微博在pc端的反扒措施较为全面.而手机端的数据则相对好爬取,而且数据都是Json格式,解 ...
- python爬取微博用户信息(一)—— 效果展示
有时,我们想要了解一个人,一般会通过ta的微博.朋友圈以及朋友的看法去了解. 特别是面对自己喜欢的明星,我们常常会浏览ta的微博,了解ta的动态. 那么,在大数据时代,数据已经成为了不可缺少的一部分, ...
- 爬虫爬取微博用户粉丝及其关注
爬虫爬取微博用户粉丝及其关注 前言 前段时间做了一个爬虫爬取微博用户粉丝及其关注的小项目,但忙着中期毕设答辩忘了加以记录了.对于动态网页的解决办法是使用selenium(上手比较快,而且抓包实 ...
- python爬取微博热搜数据并保存!
主要用到requests和bf4两个库将获得的信息保存在d://hotsearch.txt下importrequests;importbs4mylist=[]r=requests.get(ur- 很多 ...
- python爬取微博用户信息(六)—— 完整代码
本节为爬取微博用户信息的完整代码,以及项目结构. 感兴趣的小伙伴可以收藏哦! 另外,关于本代码的效果展示,以及教程,点击以下链接即可. python爬取微博用户信息(一)-- 效果展示 python爬 ...
- python爬取微博用户信息(四)—— 爬取用户信息的功能函数
这一节,将会将 MicroBlog.py 文件中的函数介绍一下. 感兴趣的小伙伴可以收藏哦! 另外,关于本代码的效果展示,以及教程,点击以下链接即可. python爬取微博用户信息(一)-- 效果展示 ...
- python爬取微博用户信息(三)—— 创建MicroBlog类实例
这一节,主要讲述 main.py文件,该文件创建了一个MicroBlog类,MicroBlog类中包含一些爬取微博内容的函数. 以及简单介绍traceback的用法. 感兴趣的小伙伴可以收藏哦! 另外 ...
最新文章
- php实现小说字典功能_PHP实现获取并生成数据库字典的方法
- 1056 Mice and Rice (25 分)【难度: 一般 / 知识点: 模拟】
- element ui登录界面_Vue和Element-UI做一个简单的登录页面
- linux网络编程之字节序
- 计算机图形学论文_论图计算
- 开关量光端机指示灯说明及常见故障问题处理方法
- 淘宝CSV每个字段的数据容量原来有限制的
- w3cschool php 调整图片尺寸,PHP_php修改上传图片尺寸的方法,本文实例讲述了php修改上传图 - phpStudy...
- oracle 31640,导数据时ora-31640报错
- linux perl 安装目录,linux-将Perl模块安装到特定位置
- 西南大学校园GIS平台
- 【Oracle】ORA-01157: cannot identify/lock data file 201 - see DBWR trace file
- mysql 数据库军规_用尽洪荒之力整理的Mysql数据库32条军规(转)
- UOJ #357. 【JOI2017春季合宿】Sparklers
- eclipse 环境安装
- 微服务网关Gateway在实战中如何结合注册中心,定义过滤器?
- Web基础(Java前端基础)
- A Pixel-Wise Distance Regression Approach for Joint Retinal Optical Disc and Fovea Detection
- matlab 电路频率响应_频率响应法与matlab指令计算
- 王家林 构建spark集群
热门文章
- python之类的构造方法
- 微信小程序笔记(三)Wepy使用记录—Stylus预编译基本使用
- Redis分布式缓存应用:主从复制master-slave,yum.安装报错Loading mirror speeds from cached hostfile 错误:M传递S成为M递归,薪火相传
- 浅谈Base64编码
- 查询网站的服务器,查询网站服务器
- 【编程素质】设计模式原则(SOLID原则)
- 离散傅里叶变换(DFT)(一)
- Java基础(八)---- if判断语句
- 鸿蒙和ios兼容吗,和安卓、iOS有何区别?一文看懂鸿蒙手机操作系统
- QT环境中 _TCHAR 和 QString 互相转换