huya弹幕提取小尝试
"""爬取实时的虎牙弹幕"""
"""不出现重复弹幕"""
"""不遗漏弹幕"""
from selenium import webdriver
import timeweb = webdriver.Chrome()
web.get('https://www.huya.com/52333')
"""第一版"""
# while True:
# bullets_chat = web.find_elements_by_xpath('//*[@id="chat-room__list"]/div/div/span[3]')
# for bullet in bullets_chat:
# if bullet.text:
# print(bullet.text)
# time.sleep(3)
# 缺点:会出现重复弹幕,为减少重复弹幕增加sleep时间会遗漏弹幕
"""第二版"""
# bbb = []
# while True:# bullets_chat = web.find_elements_by_class_name('msg')
# for bullet in bullets_chat:
# if bullet.text and bullet.text not in bbb:
# print(bullet.text)
# bbb.append(bullet.text)# time.sleep(0.5)
# 缺点 1.bbb列表会越来越大,拖慢内存 2.如果两个人发了两个相同弹幕比如哈哈哈,只会出现1个"""第三版"""
# bbb = []
# while True:# bullets_chat = web.find_elements_by_class_name('msg')
# for bullet in bullets_chat:
# if bullet.text and bullet.text not in bbb:
# print(bullet.text)
# bbb.append(bullet.text)
# if len(bbb)>20:
# del_num = len(bbb)-20
# del bbb[0:del_num-1]# time.sleep(0.5)
# 缺点:如果两个人发了两个相同弹幕比如哈哈哈,只会出现1个
最后想到的解决方案是将data-cmid也提取出来,用字典存储data-cmid 和弹幕文本实现去重
huya弹幕提取小尝试相关推荐
- 2020西瓜直播弹幕协议版弹幕提取思路与实现py
我最近一直在研究西瓜弹幕提取的方案,之前的方案是利用网页版西瓜直播提取的弹幕. 不能提取礼物,和关注等信息.后来慢慢接触知道了如何使用协议. 首先我安装了一个西瓜视频app,通过fiddler抓包工具 ...
- 微信小程序-炫酷手持滚动弹幕生成小工具
微信小程序-炫酷手持滚动弹幕生成小工具 欢迎使用Markdown编辑器 你好! 这是你第一次使用 Markdown编辑器 所展示的欢迎页.如果你想学习如何使用Markdown编辑器, 可以仔细阅读这篇 ...
- python爬虫bilibili_Python爬虫 bilibili视频弹幕提取过程详解
两个重要点 1.获取弹幕的url是以 .xml 结尾 2.弹幕url的所需参数在视频url响应的 javascript 中 先看代码 import requests from lxml import ...
- SubstanceDesigner制作PBR材质制作并且同步到Unity小尝试
SubstanceDesigner制作PBR材质制作并且同步到Unity小尝试 1.下载安装SubstanceDesigner,网址:https://zixue.3d66.com/softhtml/d ...
- 小程序源码:炫酷手持滚动弹幕生成小工具微信小程序-多玩法安装简单
这是一款滚动弹幕生成微信小程序源码 让弹幕文字在手机屏幕上跑起来,LED弹幕 手机弹幕,告白神奇,等 支持多种模板,每一种模板都支持自定义颜色等等 字体跳动,字体表白等等 另外用户也可以支持自定义文字 ...
- 小程序源码:炫酷手持滚动弹幕生成小工具
这是一款滚动弹幕生成微信小程序源码 让弹幕文字在手机屏幕上跑起来,LED弹幕 手机弹幕,告白神奇,等 支持多种模板,每一种模板都支持自定义颜色等等 字体跳动,字体表白等等 另外用户也可以支持自定义文字 ...
- 【小程序源码】手持滚动弹幕生成小工具多样化模板
这是一款滚动弹幕生成微信小程序源码 让弹幕文字在手机屏幕上跑起来,LED弹幕 手机弹幕,告白神奇,等 支持多种模板,每一种模板都支持自定义颜色等等 字体跳动,字体表白等等 另外用户也可以支持自定义文字 ...
- 微信小程序:炫酷手持滚动弹幕生成小工具
这是一款滚动弹幕生成微信小程序源码 让弹幕文字在手机屏幕上跑起来,LED弹幕 手机弹幕,告白神奇,等 支持多种模板,每一种模板都支持自定义颜色等等 字体跳动,字体表白等等 另外用户也可以支持自定义文字 ...
- 虎牙直播网页弹幕过滤小探索
虎牙直播网页弹幕过滤小探索 没过滤前,一堆 333 过滤后,舒服了 js代码 使用方法 网页看直播时候,没发现有过滤弹幕的功能,自己摸索了一下. 没过滤前,一堆 333 过滤后,舒服了 js代码 // ...
最新文章
- 图论 ---- 图论构造成二分图去判断 F. Figure Fixing
- 没有云平台,又不会代码?MicrobiomeAnalyst:一款综合的可视化微生物组学数据分析网页工具
- Linux LXC基本配置选项
- android判断以太网还是wifi,对比平台--WiFi和以太网之间的区别
- TCP服务器端和客户端建立连接 - 客户端的回调处理
- 星之卡比机器人汉化_NS国行或迎来鸡肋的脑锻炼和大金刚!好消息是卡比也快了...
- android 设置网络超时时间设置,Android:AndroidHttpClient-如何设置超时时间?
- 下来安成功 打开一直白屏_推广人透露:戈洛夫金2021年可能与安德拉德上演拳王统一战...
- ubuntu 14.04.03 LTS(64bit) 安装PyCharm
- html5 iframe 属性,html中关于iframe的allowTransparency属性的详解
- Could not resolve XML resource [null] with public ID [null], system ID [classes/ajax/dwr_web.xml]
- Flink AggOperatorWholeWin 全窗口聚合函数
- (四)最邻近插值、双线性插值
- html5新年拜年模板,拜年日记推荐借鉴模板
- ACCESS入门教程(五)数据的类型和属性
- 电子秤芯片——人体秤芯片及方案设计
- 直播六脉神剑,练好这几招才能行走江湖
- python -使用pytesseract识别文字时遇到的问题
- Codeforces Gym 101173 K. Key Knocking (构造)
- 全球及中国装配式建筑行业深度研究与发展模式咨询报告2022版