【情感打分+情感判定+词云图】python情感分析李子柒频道视频热门英文评论
目录
一、事件背景
二、python代码讲解
三、同步讲解视频
四、获取python源码文件
一、事件背景
今天是2021.12.2日,距离李子柒断更已经4个多月了,这是我在YouTube李子柒油管频道上,观看李子柒2021年7月14日上传的最后一条视频,我录制了视频下方的来自全世界各国网友的评论,全世界的网友们集体期待李子柒回归,瞬间泪奔。
知乎视频 - 李子柒频道视频热门评论
针对全世界网友的热门评论,怎么分析出网友的评论态度和舆论导向呢?于是我试着用python做了情感分析,得出了一些舆情导向的结论。
二、python代码讲解
下面,通过python代码(部分核心代码)逐一分解,这个情感分析是怎样实现的:
首先,导入需要的库:
import pandas as pd # 数据分析库
from textblob import TextBlob # 英文情感分析库
import matplotlib.pyplot as plt # 画图
from wordcloud import WordCloud # 绘制词云图
from wordcloud import ImageColorGenerator
from PIL import Image
import numpy as np
然后,通过pandas读取excel评论数据(爬虫代码不做讲解,对爬虫代码感兴趣的小伙伴可以私聊我哦)
file = "李子柒评论.xlsx"
df = pd.read_excel(file, usecols=[1, 2, 3, 4, 5]) #读取评论数据
v_cmt_list = df['text'].values.tolist() # 把评论字段转换为list
print('length of v_cmt_list is:{}'.format(len(v_cmt_list)))
下面是情感分析的代码:
# 情感分析
score_list = [] # 情感评分值
tag_list = [] # 打标分类结果
for comment in v_cmt_list:tag = ''judge = TextBlob(comment)sentiments_score = judge.sentiment.polarityscore_list.append(sentiments_score)if sentiments_score < 0:tag = '消极'elif sentiments_score == 0:tag = '中性'else:tag = '积极'tag_list.append(tag)
df['情感得分'] = score_list
df['分析结果'] = tag_list
df.to_excel('情感分析结果.xlsx', index=None)
查看一下情感分析结果:
df.groupby(by=['分析结果']).count()['text'] # 分组统计情感分析结果
结果显示,中性和积极词汇占据一半以上,也就是说,大部分网友还是喜欢李子柒的视频的。
最后是词云图绘制的代码:
# 绘制词云图
stopwords = ['the', 'a', 'and', 'of', 'it', 'her', 'she', 'if', 'I', 'is', 'not', 'your', 'there', 'this','that', 'to', 'you', 'in', 'as', 'for', 'are', 'so', 'was', 'but', 'with', 'they', 'have'] # 停用词
coloring = np.array(Image.open("lzq3.jpeg"))
backgroud_Image = coloring # 读取背景图片
wc = WordCloud(scale=3, # 图片大小,清晰度background_color="white", # 背景颜色max_words=1000, # 词数量font_path='/System/Library/Fonts/SimHei.ttf', # Mac字体文件路径,根据实际情况替换# font_path="C:\Windows\Fonts\simhei.ttf", # Win字体文件路径,根据实际情况替换stopwords=stopwords, # 停用词mask=backgroud_Image, # 背景图片color_func=ImageColorGenerator(coloring), # 根据原始图片颜色生成词云图颜色max_font_size=100, # 设置字体最大值random_state=240 # 设置有多少种随机生成状态,即有多少种配色方案
)
wc.generate(v_cmt_str) # 生成词云图
wc.to_file('词云结果图.png') # 保存图片文件
display(Image.open('lzq3.jpeg')) # 显示原始图片
wc.to_image() # 显示词云图
词云图最后的展示效果如下:
这里需要说明的是,color_func=ImageColorGenerator(coloring)这句代码,能够根据原始图片颜色生成词云图颜色。细心的小伙伴应该能看出来,词云图的颜色配比和原始图片的颜色配比很接近了。
三、同步讲解视频
讲解视频:
3分钟讲解用python代码,情感分析李子柒油管频道评论
四、获取python源码文件
爱学习的小伙伴,想获取完整python代码文件,关注我的微信公众号"老男孩的平凡之路",后台回复"李子柒情感分析",即可获取完整python源码及结果文件。点击链接直达↓
【Python情感分析】用python情感分析李子柒频道视频热门评论一、事件背景今天是2021.12.2日(日期没错,转自马哥知乎往期文章),距离李子柒断更已经4个多月了,这是https://mp.weixin.qq.com/s?__biz=MzU5MjQ2MzI0Nw==&mid=2247484565&idx=1&sn=ffd0f5e69a490f3fcf82109ea637b721&chksm=fe1e1075c9699963af56beda45cc010a1b515f87aa68a6443878a8e575e6ca57b53f4b449475&payreadticket=HLFBI00L_inc8Ul4LG_PKeZ9lkYuDEDLi03J5hjohpGC_by7jTbbayE1YtcMmWfrWKtLd7Y#rd
我是马哥,全网累计粉丝上万,欢迎一起交流python技术。
各平台搜索“马哥python说”:知乎、哔哩哔哩、小红书、新浪微博。
【情感打分+情感判定+词云图】python情感分析李子柒频道视频热门英文评论相关推荐
- python125免费教程,125 个视频成就千万级网红,Python 告诉你李子柒都在拍些什么?...
原标题:125 个视频成就千万级网红,Python 告诉你李子柒都在拍些什么? 作者 |Mika,数据 |真达 后期 |Mika.泽龙 责编 | 郭芮 来源 | CDA数据分析师 今天我们来聊聊把生活 ...
- 125 个视频成就千万级网红,Python 告诉你李子柒都在拍些什么?
作者 | Mika,数据 | 真达 后期 | Mika.泽龙 责编 | 郭芮 来源 | CDA数据分析师 今天我们来聊聊把生活过成诗的李子柒. "李家有女,人称子柒."如果说到当下 ...
- 实例:爬取豆瓣评论、绘制词云图以及情感分析——以《长津湖》为例
一.爬取豆瓣<长津湖>网页评论 (由于存在一定的反爬机制,以下代码最多只能爬取210条评论) # 导入工具包 import requests from bs4 import Beautif ...
- wordcloud词云图(python)
有时候,我们想要从一篇文章中提取我们所需要的关键词.这时我们可以使用词云的方式创建词云图来快速提取文章中的重点词语. 那我们应该如何创建一个如下的词云图呢? 链接: https://pan.baidu ...
- mysql数据生成词云图_CVPR2018关键字分析生成词云图与查找
今日目标:爬取CVPR2018论文,进行分析总结出提到最多的关键字,生成wordCloud词云图展示,并且设置点击后出现对应的论文以及链接 对任务进行分解: ①爬取CVPR2018的标题,简介,关键字 ...
- 仅拍125个视频就成为千万级网红? Python告诉你:李子柒的网红路
"李家有女,人称子柒."如果说到当下最火的网红,想必很多人都会想到李子柒. 日出而作,日落而息,看似平淡无奇的日子,李子柒却总能过成一首诗.一幅画. 三月桃花熟了,采来酿桃花酒.四 ...
- 利用python绘制简易词云图(使用jieba进行中文分词)
词云(wordcloud)图能过滤掉大量的文本信息,使我们能抓住问题的集中点(一般集中点就是经常提到的点,也就是词频数会比较高).其实制作词云没什么技术含量,主要就是将用于绘制词云的所有词都传给软件, ...
- python爬取网页版QQ空间,生成词云图、柱状图、折线图(附源码)
python爬取网页版QQ空间,生成词云图.柱状图.折线图 最近python课程学完了,琢磨着用python点什么东西,经过一番搜索,盯上了QQ空间,拿走不谢,欢迎点赞收藏,记得github给个sta ...
- php生成云图,教程:用Python生成词云图
一. 词云图 "词云"就是对网络文本中出现频率较高的"关键词"予以视觉上的突出,形成"关键词云层"或"关键词渲染",从而 ...
最新文章
- android屏幕分享软件,ScreenStream(屏幕分享)
- vue.jsr入门_JSR-308和Checker框架为jOOQ 3.9添加了更多类型安全性
- HTML5 基础知识
- JavaScript:通过id来进行元素的取得
- 计算机任务管理器恢复默认,关于任务管理器的一个问题??
- Safari浏览器显示网页不全问题解决方法
- 基于物联网的智慧农业监测系统(前端界面有web端和微信小程序端)
- SM4算法大文件加密与字符串加密
- threejs LOD
- 炸弹战争1.1版 可以刷新炸弹
- win10下禁止自动更新,Window Update禁用无效后续方法
- 国内邮箱免费邮箱注册哪个好?
- VNC共享剪切板,打开远程复制粘贴功能
- 次世代游戏建模师,一个极受追捧的高薪职业!
- MySQL学习笔记1:数据库概述(尚硅谷)
- Android设置唤醒键唤醒系统的功能
- 正点原子 高速DAP 下载器解除芯片读保护
- ubuntu server 18.04 first config
- Audio 音频总线
- win10安装ubuntu 20.04 LTS