image

CDA数据分析师 出品

作者:Mika

数据:<typo id="typo-29" data-origin="真达" ignoretag="true">真达</typo>

后期:泽龙

【导读】

最近《三十而已》这部剧频频霸占微博热搜,今天我们就来聊一聊。

Python技术部分请直接看第四部分

Show me data,用数据说话

今天我们聊一聊 《三十而已》

《乘风破浪的姐姐》已成为这个夏天最火爆的话题,前有国综"浪姐"高歌猛进,后有这部剧版"浪姐"《三十而已》让人眼前一亮。

最近微博热搜几乎都被这部剧承包了,几乎是每播一集就能上热搜的那种,让<typo id="typo-236" data-origin="你没" ignoretag="true">你没</typo>追剧都能知道剧情进展到哪儿了。

image

在这部剧中,江疏影、童瑶和毛晓彤三人携手演绎了30岁都市女性的3种人生以及所面对的3种困境。剧中各种名场面也是让这部剧彻底出圈了。

童瑶饰演的全职太太顾佳,江湖人称:许子言妈妈、散打教练、特级甜品师、情商管理专家、育儿专家、儿童心理学者、中国好闺蜜、顶级宫斗高手、幻山烟花公司幕后老。

为了保护儿子,手撕伤害儿子的人

image

为融入贵妇圈

掏家底也要买爱马仕鸵鸟皮Kelly28

image

image

江疏影饰演的是奢侈品店的销售王漫妮,妥妥的一名沪漂。演绎了目前社会上很多“社畜”的真实生活,生病了身边照顾自己的人都没有,只能一个人住院。

毛晓彤饰演的钟晓<typo id="typo-549" data-origin="芹" ignoretag="true">芹</typo>是一个普通的上海小囡nan,她的婚姻看似稳定,但与丈夫却貌合神离,一个大大咧咧神经大条,另一个沉默寡言、不愿沟通。

image

image

image

那么这部《三十而已》是怎么火起来的?

哪些点最戳中观众的心呢?

今天我们就来用数据带你盘一盘。

01女性角色不断霸屏

近几年这类聚焦女性的影视剧层出不穷:

美剧方面

  • 《致命女人》堪称复仇类肥皂剧顶级配置,
  • 《大小谎言》将家庭里的谎言、爱与暴力演绎的淋漓尽致,
  • 《了不起的麦瑟尔夫人》则让我们看到了上个世纪女性的辛酸和成长
image

image

image

  • 英剧《杀死伊芙》上演了一场正邪双方的猫鼠游戏
  • 《我的天才女友》讲述了发生在意大利那不勒斯小城一段跨越漫长岁月的友谊
  • 日剧《东京女子图鉴》和韩剧《请输入搜索词:WWW》也都将焦点<typo id="typo-888" data-origin="剧集" ignoretag="true">剧集</typo>在都市女性的日常生活和职场中。
image

image

image

而今年夏天,屏幕上活跃的女性身影更是不少。前有《乘风破浪的姐姐们》引发的全民讨论,之后的国产剧《二十不惑》和《三十而已》不约而同把话题指向女性的年龄问题。

image

02《三十而已》怎么突然火了

一开始也许没人想到,这样一部聚焦女性角度的国产都市剧能在这个夏天彻底火了。看到百度指数,对比同期播出也是围绕女性话题的《二十不惑》,《三十而已》的热度和搜索度都要高出很多,从7月17日首播起热度就高居不下。

image

目前微博话题《三十而已》阅读量达到42.2亿,讨论达到148.8万。该剧也频频霸占微博热搜,几乎更新一集就会有新的热搜,让你忍不住去追剧。

image

看剧中,你会折服于顾佳的强大家庭女性人设;

image

剧中钟晓芹的老公陈屿是非常有争议的角色。他在婚姻中对妻子不关心不沟通的态度让很多人气愤不已,一度微博话题被#陈屿气死#还上了热搜。

image

甚至还有像“众盼芹离”这样的词都出来了。

image

03《三十而已》中是什么最戳中观众的心?

*<u>1</u>*****豆瓣数据

接着我们分析了豆瓣的短评数据。目前这部剧豆瓣上共有4万2千余人进行评分,分数为8分。在国产剧中是很不错的成绩了。

image

在评分方面,我们以其中500条数据为代表。

评论中提到最多的主演

image

我们进行排序发现位居首位的是王漫妮,然后是顾佳和钟晓芹。

豆瓣小组主演话题热度

image

对比一下在《三十而已》的豆瓣小组里,讨论话题度最高的就属陈屿了。

豆瓣评论词云

image

豆瓣评论中主要围绕的关键词有"女性"、"剧情"、"喜欢"等方面。演员中"江疏影"、"童瑶"也被多次提到。

*<u>2</u>*****腾讯视频弹幕

接下来我们还分析整理了腾讯视频弹幕数据,目前共出了 15集,共整理了271049条弹幕。

首先,看到用户在发弹幕时最喜欢选用的角色标签排名:

用户喜欢用的弹幕角色

image

其中王漫妮排名第一,顾佳、钟晓芹分别位居二三。这方面与豆瓣一致。男性角色排名是陈屿以及许幻山。

再看到不同角色的弹幕词云:

王漫妮弹幕词云

image

江疏影饰演的王漫妮讨论度很高,这也与演员的演技和本身的人气是分不开的。气质这块拿捏的死死的,而且作为奢侈品店销售,王漫妮在话术和专业度上也让人感觉很真实。

顾佳弹幕词云

image

下面是童瑶饰演的全职太太顾佳。顾佳谐音这个名字照顾家庭,不仅要照顾孩子,把家里打理的井井有条,还有扶持老公的烟花公司,这个女人实在是太不一般了。关键词中 "厉害"、"聪明"、"完美"被多次提到。

钟晓芹弹幕词云

image

钟晓芹作为普通的上海本地小姑娘,性格"单纯可爱"。而面对一点也不善解人意的老公,弹幕中感叹"怎么还不离婚"的也特别多。

陈屿弹幕词云

image

陈屿和许幻山两个丈夫都有各自的问题。陈屿性格冷漠,关心自己养的鱼胜过老婆。

许幻山弹幕词云

image

许幻山是纯粹的烟花设计艺术家,在公司运营方面显得"幼稚",不懂"人情世故",这些方面还真不如他的老婆顾佳。

04如何用Python获取弹幕数据

我们使用Python获取并分析了《三十而已》的腾讯弹幕数据,来分析看看哪个角色最受欢迎。分析流程分为以下几步:

  1. 弹幕数据获取和数据读入
  2. 数据预处理
  3. 数据可视化分析

<u>1</u> 数据读入

首先导入所需包。

import os
import jieba
import numpy as np
import pandas as pd from pyecharts.charts import Bar, Pie, Line, WordCloud, Page
from pyecharts import options as opts
from pyecharts.globals import SymbolTypeimport stylecloud
from IPython.display import Image # 用于在jupyter lab中显示本地图

然后使用pandas循环读取数据。

data_list = os.listdir('../data/')df_all = pd.DataFrame()for i in data_list:# 判断if i.split('.')[-1] == 'csv':  df_one = pd.read_csv(f'../data/{i}', engine='python', encoding='utf-8', index_col=0)  df_all = df_all.append(df_one, ignore_index=False)df_all.info()
Int64Index: 271049 entries, 0 to 17637
Data columns (total 7 columns):#   Column      Non-Null Count   Dtype
---  ------      --------------   ----- 0   episodes    271049 non-null  int64 1   comment_id  271049 non-null  int64 2   oper_name   139035 non-null  object3   vip_degree  271049 non-null  int64 4   content     271049 non-null  object5   time_point  271049 non-null  int64 6   up_count    271049 non-null  int64
dtypes: int64(5), object(2)
memory usage: 16.5+ MB

此次一共获取了15集2271049条弹幕数据,每集平均18069条,按照每集平均45分钟计算,每分钟平均401条弹幕,数据预览如下:

pattern = r'(王漫妮\s*|钟晓芹\s*|顾佳\s*|陈屿\s*|许幻山\s*|飒飒\s*|浪浪\s*):.*'
df_all['danmu_role'] = df_all['content'].str.extract(pattern)[0].str.strip()# 定义函数
def transform_name(x):if x=='王漫妮' or x=='顾佳' or x=='钟晓芹' or x=='陈屿' or x=='许幻山' or x=='飒飒' or x=='浪浪':return 'VIP用户'elif x=='NaN':return '未知用户'else:return '普通用户'df_all['danmu_level'] = df_all['danmu_role'].apply(transform_name)
df_all.head()
image

<u>2</u> 数据预处理

此处对弹幕角色和VIP用户进行处理。

pattern = r'(王漫妮\s*|钟晓芹\s*|顾佳\s*|陈屿\s*|许幻山\s*|飒飒\s*|浪浪\s*):.*'
df_all['danmu_role'] = df_all['content'].str.extract(pattern)[0].str.strip()# 定义函数
def transform_name(x):if x=='王漫妮' or x=='顾佳' or x=='钟晓芹' or x=='陈屿' or x=='许幻山' or x=='飒飒' or x=='浪浪':return 'VIP用户'elif x=='NaN':return '未知用户'else:return '普通用户'df_all['danmu_level'] = df_all['danmu_role'].apply(transform_name)
df_all.head()
image

<u>3</u> 数据可视化

弹幕发送人群等级分布

data_pair =  [list(z) for z in zip(level_num.index.tolist(), level_num.values.tolist())]# 绘制饼图
pie1 = Pie(init_opts=opts.InitOpts(width='1350px', height='750px'))
pie1.add('', data_pair, radius=['35%', '60%'])
pie1.set_global_opts(title_opts=opts.TitleOpts(title='弹幕发送人群等级分布'), legend_opts=opts.LegendOpts(orient='vertical', pos_top='15%', pos_left='2%'))
pie1.set_series_opts(label_opts=opts.LabelOpts(formatter="{b}:{d}%"))
pie1.set_colors(['#6FB27C', '#FFAF34'])
pie1.render()

用户最喜欢使用的弹幕角色?

role_num.drop(['飒飒', '浪浪'], inplace=True)# 柱形图
bar1 = Bar(init_opts=opts.InitOpts(width='1350px', height='750px'))
bar1.add_xaxis(role_num.index.tolist())
bar1.add_yaxis("", role_num.values.tolist(), category_gap='5%')
bar1.set_global_opts(title_opts=opts.TitleOpts(title="VIP用户最喜欢使用的弹幕角色"), visualmap_opts=opts.VisualMapOpts(max_=21027),)
bar1.render()

弹幕角色-王漫妮 词云图

text1 = get_cut_words(content_series1) # 绘制词云图
stylecloud.gen_stylecloud(text=' '.join(text1), max_words=1000,collocations=False,font_path=r'C:\Windows\Fonts\msyh.ttc',icon_name='fas fa-heart',size=653,output_name='./html/弹幕角色王漫妮-词云图.png')

结语:

一直以来在世俗的眼光下,婚姻、事业、家庭,是30+女性绕不开的话题。年过三十,不是结婚生子,就是在结婚生子的路上,但对于没有结婚的很可能被称“大龄剩女”。

近年来,关于女性年龄的讨论更是被推到了风口浪尖。综艺《浪姐》播出后,看到一位位30+的女嘉宾在舞台上"兴风作浪",弹幕中有女生留言“好像没那么害怕变老了“而《三十而已》更是展现了30+女性的不同生活状态和机遇,其实女性的人生,不应该被年龄所定义。

三十而已,年华正好!

无论哪个年龄阶段都有不同的精彩!

image


http://www.taodudu.cc/news/show-3318001.html

相关文章:

  • 用Python数据分析告诉你,《三十而已》凭什么这么戳中观众的心
  • 去毛边 叶片图像_一种复杂背景叶片图像的全自动分割方法与流程
  • 常用口语
  • 工作一周年快乐_30周年快乐Excel!
  • Python 全栈 400 之Pandas数据分析练习
  • vs登陆界面空白_20190806 退戈、临渊鱼儿、月照溪等作者新文完结|千金VS痞子|女扮男装...
  • jdbc 生成建表语句_mysql数据库下建表语句
  • 切备库重建索引 mysql_mysql 重建索引
  • php7可变参数,7PHP可变变量
  • java string转number_string转换成number
  • 牛客网习题
  • SHEIN能撑起千亿美金的估值吗?
  • ailx10的hacknet攻略007
  • 鐘明系列十:『32阶3次幻方』
  • 游戏锁30帧会不会更具电影质感?
  • 12 | 缓存:数据库成为瓶颈后,动态数据的查询要如何加速?-学习笔记
  • 大数据面试题集
  • 数据库事务特征、数据库隔离级别,各级别数据库加锁情况(含实操)--read committed MVCC...
  • 大数据入门没有头绪?这份总结的大数据学习路线希望你用得着
  • 从简历被拒到收割今日头条 offer,我用一年时间破茧成蝶!
  • 字节跳动春招攻略:学长学姐笔经面经,还有出题人「锦囊」
  • 春招攻略:我是怎样进入字节跳动做技术的
  • 冲|2年CRUD|社招|后端开发|上岸面试分享(附面经)
  • 一问Redis只知道是key-value类型数据库?它可远不止这些!
  • Kafka消息队列学习笔记1——Kafka入门1
  • 太原学院计算机15级花名册,我们是小小模范生!点击收获这份青春的花名册
  • python爬取百度新闻_火车浏览器网络爬虫实践6:以“陕茶”为例爬取百度新闻搜索结果...
  • 同步非同步阻塞非阻塞 总结与区别
  • 线程池详解
  • 洛阳市计算机学校分布在什么地方,2019年洛阳中小学学区划分最新分布图_洛阳学区划分图...

数据告诉你,剧版浪姐-《三十而已》凭什么这么戳中观众的心相关推荐

  1. 数据告诉你,剧版“浪姐“-《三十而已》凭什么这么戳中观众的心

    CDA数据分析师 出品 作者:Mika 数据:真达 后期:泽龙 [导读] 最近<三十而已>这部剧频频霸占微博热搜,今天我们就来聊一聊. Python技术部分请直接看第四部分. Show m ...

  2. 剧版浪姐口碑爆了!数据告诉你,《三十而已》凭什么这么戳中观众的心

    ▼ 更多精彩推荐,请关注我们 ▼ 作者:Mika 数据:真达   后期:泽龙 [导读] 最近<三十而已>这部剧频频霸占微博热搜,今天我们就来聊一聊. Python技术部分请直接看第四部分. ...

  3. 剧版浪姐口碑爆了!数据告诉你《三十而已》凭什么火

    来源:CDA数据分析师 本文约3100字,建议阅读8分钟. 最近<三十而已>这部剧频频霸占微博热搜,今天我们就来聊一聊. <乘风破浪的姐姐>已成为这个夏天最火爆的话题,前有国综 ...

  4. 用Python数据分析告诉你,《三十而已》凭什么这么戳中观众的心

    点击上方"Python爬虫与数据挖掘",进行关注 回复"书籍"即可获赠Python从入门到进阶共10本电子书 今 日 鸡 汤 欲穷千里目,更上一层楼.  CDA ...

  5. SRPG游戏开发(三十四)第八章 游戏中的数据 - 四 数据编辑器(Data Editor)

    返回总目录 第八章 游戏中的数据(Data in Game) 在之前的章节中,我们进行地图对象的生成,移动等操作. 这一章本来可以进行战斗的编写,不过数据缺失是一个问题. 所以这一章我们先来建立一些数 ...

  6. 已知p是一个指向类a的数据成员m的指针_第三十八章、结构体指针、单向链表简介...

    最近比较忙,一下子有好几天没更新了,今天我们先来了解下结构体指针. 和普通的指针一样,结构体指针就是指向结构体变量的指针. 结构体指针指向的是结构体变量的起始位置. 1. 声明结构体指针 我们用一幅图 ...

  7. 狸窝全能转换器安卓版_第三十二讲 如何运用“狸窝”剪辑视频

    如何运用"狸窝"剪辑视频 在PPT制作中,视频的插入运用已很普遍.PPT视频都是由老师们精心选择之后呈现给学生的最具代表性的内容,由于课时有限,课堂上呈现的视频时间比较短暂,就需要 ...

  8. 第三十四篇:在SOUI中使用异步通知

    概述 异步通知是客户端开发中常见的需求,比如在一个网络处理线程中要通知UI线程更新等等. 通常在Windows编程中,为了方便,我们一般会向UI线程的窗口句柄Post/Send一个窗口消息从而达到将非 ...

  9. 张宇基础三十讲(第一轮复习中不会做的题目留存)

    书上例题 2022年5月23日第九讲 一元函数积分学的几何应用 例题9.8

最新文章

  1. 构建从目标到研发过程的全生命周期体验
  2. Python基础知识(第五天)
  3. 统计学习:方差分析(ANOVA2)
  4. 线下沙龙 | 小身材大能量!用英伟达智能小车Jetbot玩转深度学习
  5. BeetleX自定义http/websocket压测用例视频
  6. LeetCode之Relative Ranks
  7. PostgreSQL Oracle 兼容性之 - rownum
  8. 【ES7(2016)】幂运算符**
  9. 连载08:软件体系设计新方向:数学抽象、设计模式、系统架构与方案设计(简化版)(袁晓河著)...
  10. 算法每日学打卡:01-21打卡(解答后面整理)
  11. vb显示文件列表_VB基本操作题4/150
  12. 读懂 SOLID 的「里氏替换」原则
  13. android上ps/grep/kill组合杀死mediaserver/system_server
  14. Android OTA升级(1):编译升级全包
  15. Bernoulli-Gaussian分布
  16. 图解WinHex使用入门
  17. Shell脚本速查手册
  18. 51单片机和315M无线发射模块编码与解码
  19. 百度云视频 在线倍速播放
  20. 单核处理器、多核处理器、多处理器与多线程编程

热门文章

  1. Vant Weapp的使用——微信小程序
  2. 雷达仿真 基于C++(1)
  3. 从3K到30K这个程序员经历了什么
  4. 已知坐标增量求坐标方位角_测量员经常应用到的坐标测量!干货!
  5. mysql 随机生成中文名_mysql随机生成名字
  6. 黑马程序员C++实战(二)——基于多态的职工管理系统完整代码
  7. Mybatis源码阅读之二——模板方法模式与Executor
  8. 弄点‘爬叉’吃吃 (原创)
  9. FinClip的发展历程
  10. Cleave input输入框 自动格式化内容