效果预览

以B站UP主可乐三太火影1-720集解说视频2020-08-07弹幕爬取为例,生成词云

代码

# -*- coding: utf-8 -*-
# @Time    : 2020/8/8 22:11
# @Author  : 马拉小龙虾
# @FileName: B站弹幕.py
# @Software: PyCharm Community Edition
# @Blog    :https://blog.csdn.net/weixin_43636302import requests
import re
import csv
import jieba
import wordcloud
import imageiourl='https://api.bilibili.com/x/v2/dm/history?type=1&oid=221043705&date=2020-08-07'
headers={"user-agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/79.0.3945.79 Safari/537.36","cookie": "CURRENT_FNVAL=16; _uuid=B326CD2D-ADC8-3C72-334C-4A2A40721CC147846infoc; buvid3=A24B3812-B914-4A54-B0E7-961056380B82155813infoc; LIVE_BUVID=AUTO8815874584533113; DedeUserID=384518184; DedeUserID__ckMd5=83c10ef34d2c30d2; SESSDATA=94aef4fd%2C1603010487%2C36962*41; bili_jct=b0d997baee67db6eda7444a7291f275f; rpdid=|(J~R)uR|Jk)0J'ul)~Rl)Rml; PVID=1; sid=ix435wln; bfe_id=fdfaf33a01b88dd4692ca80f00c2de7f"
}
res=requests.get(url=url,headers=headers)
res.encoding = 'utf-8'
print(res.text)
print(res.content.decode(encoding='utf-8'))
txt=res.content.decode(encoding='utf-8')
danmu=re.findall('p.*?>(.*?)<',txt)
print(danmu)
# f=open('danmu.csv','w',newline='',encoding='utf-8-sig')
# writer=csv.writer(f)
# # writer.writerow(danmu)
# for i in danmu:
#     writer.writerow([i])
f2=open('danmu.csv','r',newline='',encoding='utf-8')
txt2=f2.read()
print(txt2)
txt_list=jieba.lcut(txt2)
print(txt_list)
string=" ".join(txt_list)
print(string)mk=imageio.imread('鸣人3.jpg')
w=wordcloud.WordCloud(width=1000,height=800,background_color='white',font_path='msyh.ttc',scale=15,mask=mk,stopwords={" "},contour_width=5,contour_color='red'
)w.generate(string)
w.to_file('b_danmu.png')

爬取B站视频弹幕生成词云相关推荐

  1. python爬取bilibili弹幕_用Python爬取B站视频弹幕

    原标题:用Python爬取B站视频弹幕 via:菜J学Python 众所周知,弹幕,即在网络上观看视频时弹出的评论性字幕.不知道大家看视频的时候会不会点开弹幕,于我而言,弹幕是视频内容的良好补充,是一 ...

  2. Python入门--爬取淘宝评论并生成词云

    Python爬取淘宝评论并生成词云 最新修改于2021/04/01 所需相关Python第三方库(目前最新版本即可) 推荐使用Anaconda,其使用十分方便.快捷. requests库 json库 ...

  3. python3抓取b站弹幕_python3写爬取B站视频弹幕功能

    需要准备的环境: 一个B站账号,需要先登录,否则不能查看历史弹幕记录 联网的电脑和顺手的浏览器,我用的Chrome Python3环境以及request模块,安装使用命令,换源比较快: pip3 in ...

  4. python 爬取B站视频弹幕信息

    获取B站视频弹幕,相对来说很简单,需要用到的知识点有requests.re两个库.requests用来获得网页信息,re正则匹配获取你需要的信息,当然还有其他的方法,例如Xpath. 进入你所观看的视 ...

  5. 爬取京东商品评价并生成词云

    上期为大家介绍了requests库的基本信息以及使用requests库爬取某东的商品页,收到了很多同学的反馈说期待猪哥的更新,猪哥感到非常开心,今天就带大家来玩一把刺激的! 一.需求背景 在实际开发过 ...

  6. python爬取QQ空间说说并生成词云

    以下是生成的词云图  我的环境:Mac,Anaconda,Python2.7,以及各种用到的Python库 先来说下Anaconda Anaconda 是一个可用于科学计算的 Python 发行版,支 ...

  7. 豆瓣电视剧评论的爬取以及进行情感分析+生成词云

    很多时候我们要了解一部电视剧或电影的好坏时都会去豆瓣上查看评分和评论,本文基于豆瓣上对某一部电视剧评论的爬取,然后进行SnowNLP情感分析,最后生成词云,给人一个直观的印象 1. 爬取评论 以前段时 ...

  8. python电影评论的情感分析流浪地球_python爬取豆瓣流浪地球影评,生成词云

    代码很简单,一看就懂. (没有模拟点击,所以都是未展开的) 地址: https://movie.douban.com/subject/26266893/reviews?rating=&star ...

  9. bilibili怎么设置弹幕数量_python爬取B站视频弹幕分析并制作词云

    1.分析网页 视频地址: www.bilibili.com/video/BV19E- 本身博主同时也是一名up主,虽然已经断更好久了,但是不妨碍我爬取弹幕信息来分析呀. 这次我选取的是自己 唯一的爆款 ...

最新文章

  1. matlab和python哪个运行快_MATLAB比Python更快吗?
  2. Alpha阶段第2周/共2周 Scrum立会报告+燃尽图 04
  3. 剑指offer:合并两个排序的链表
  4. jar包天天见,可是你知道它的运行机制吗
  5. 根据从日期控件选定的时间以表格形式显示数据_VB项目开发FlexGrid控件使用讲解...
  6. redhat bash: yum: 未找到命令..._常用linux yum 命令和 vim命令,这几个要熟记
  7. PowerDesigner(五)-概念数据模型(CDM生成LDM,PDM和OOM)
  8. mysql 错误编码_【分享】MySQl操作系统提示错误编码
  9. XML入门经典(第4版)pdf
  10. [转]nonlocal和global
  11. 多元高斯分布的边缘概率和条件概率
  12. C#的yield return是怎么被调用到的?
  13. 易宝Java版在线支付
  14. python normalize函数_Python Pandas Series.dt.normalize用法及代码示例
  15. Oracle语句优化规则
  16. 电脑桌面一计算机打不开怎么办,电脑桌面什么都打不开怎么办
  17. Pytorch实现GAN之生成手写数字图片
  18. 企业工商四要素核验是对哪些信息进行验证?
  19. 抖音直播带货数据复盘怎么做?如何复盘提高直播间转化率?
  20. 功耗大好还是小好_额定功率大好还是小好

热门文章

  1. Unity 通用弹出框
  2. mac使用迅雷下载资源
  3. 2020 AAAI-GMAN: A Graph Multi‐Attention Network for Traffic Prediction阅读笔记(翻译)
  4. c语言水果程序,C语言写的简易水果管理系统
  5. java roll_Java Calendar roll()用法及代碼示例
  6. android如何实现qq登陆和qq分享,2021超详细mob平台图解教程?
  7. android ndk : error pluginprotocolstatic: local_src_files 错误
  8. 5.随机输入一个整数,判断输入的数是正数、负数还是0,如果是正数那么我们输出,”刚刚输入的一个正数”,如果是负数,那么我们输出,”刚刚输入的那个数是负数”,如果我们输入的0的话,那么我们出输,”刚刚输
  9. 理解数字信号处理的三把钥匙
  10. duo是什么意思_duo是什么意思_duo的翻译_音标_读音_用法_例句_爱词霸在线词典