import requests

import re

av_id = '67946325'

headers = {

'User-Agent':'Mozilla/5.0 (X11; Linux x86_64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/69.0.3497.100 Safari/537.36',

'Accept': 'text/html',

'Cookie': "嘿嘿"

}

resp = requests.get('https://www.bilibili.com/video/av'+av_id,headers=headers)

match_rule = r'cid=(.*?)&aid'

oid = re.search(match_rule,resp.text).group().replace('cid=','').replace('&aid','')

print('oid='+oid)

xml_url = 'https://api.bilibili.com/x/v1/dm/list.so?oid='+oid

resp = requests.get(xml_url,headers=headers)

if resp.encoding == 'ISO-8859-1':

encodings = requests.utils.get_encodings_from_content(resp.text)

if encodings:

encoding = encodings[0]

else:

encoding = resp.apparent_encoding

global encode_content

encode_content = resp.content.decode(encoding,'replace')

print(encode_content)

#爬虫headers需要包含什么内容才不会返回404呢?我尝试7个全写,发现就不对。

#正则表达式快忘记了……

#最后的乱码解决方案

python爬b站弹幕_【Python爬虫】第五课(b站弹幕)相关推荐

  1. python爬取地图地址_网络爬虫-python爬取高德地图地点

    python爬取你想要的数据,近期由于业务需求,用python爬取了高德地图一些地点的数据,爬出来数据大致情况如下: image 下面是基本流程: 2.安装网络爬取第三方库,主要是下面三个(pip i ...

  2. python爬取论坛图片_[python爬虫] Selenium定向爬取虎扑篮球海量精美图片

    前言: 作为一名从小就看篮球的球迷,会经常逛虎扑篮球及湿乎乎等论坛,在论坛里面会存在很多精美图片,包括NBA球队.CBA明星.花边新闻.球鞋美女等等,如果一张张右键另存为的话真是手都点疼了.作为程序员 ...

  3. python爬取妹子图片_利用爬虫爬取清纯妹子图片

    该楼层疑似违规已被系统折叠 隐藏此楼查看此楼 from bs4 import BeautifulSoup import requests import time import os def get_h ...

  4. python爬取携程网游记_网页爬虫 - 用python selenium抓取携程信息

    问 题 最近在学习selenium,遇到一个很奇怪的问题,debug了半天还是没弄明白,我是在测试抓取携程网站的机票信息 我的代码: # -*- coding: utf-8 -*- from sele ...

  5. python爬取高德地图_爬虫实战:如何爬取高德地图?

    提起高德地图,咱们每一个人都不会陌生,高德地图是一款非常好用的地区服务软件,很多用户在出行的时候都会使用这款软件,日程用来导航,也可以用来打车,一次呼叫多种车型,用户可以在这里获得更好的服务,随时都可 ...

  6. python爬取qq电话_用Python爬取整个学院MM的电话和QQ,爬虫这也太霸道了!

    1. python爬虫可以爬取大规模数据.Python具有丰富和强大的库.它常被昵称为胶水语言,能够把用其他语言制作的各种模块(尤其是C/C++)很轻松地联结在一起.基本上可以负责任地认为,Pytho ...

  7. python爬取豆瓣短评_爬虫-爬取豆瓣短评

    爬虫-爬取豆瓣短评 啥是爬虫? ​按照一定的规则,自动地抓取互联网信息的程序. 为啥要用爬虫? ​可以利用爬虫自动地采集互联网中的信息,采集回来后进行相应的存储或处理,在需要检索某些信息的时候,只需在 ...

  8. python 知乎美女_知乎大神用Python爬取高颜值美女(爬虫+人脸检测+颜值检测)

    原标题:知乎大神用Python爬取高颜值美女(爬虫+人脸检测+颜值检测) 1 数据源 知乎话题『美女』下所有问题中回答所出现的图片 2 抓取工具 Python 3,并使用第三方库 Requests.l ...

  9. python爬取qq电话_用Python爬取整个学院MM的电话和QQ,爬虫这也太牛了!

    文章末尾有python全套学习资料领取 1. python爬虫可以爬取大规模数据.Python具有丰富和强大的库.它常被昵称为胶水语言,能够把用其他语言制作的各种模块(尤其是C/C++)很轻松地联结在 ...

  10. python 爬取财经新闻_如何用 100 行 Python 代码实现新闻爬虫?

    CSDN",选择"置顶公众号" 关键时刻,第一时间送达! 每天我都要坐地铁上班,而地铁里完全没有手机信号.但我希望在坐地铁的时候读些新闻,于是就写了下面这个新闻爬虫. 我 ...

最新文章

  1. JavaScript的过去、现在和未来--过去
  2. vue cli3.3 以上版本配置vue.config.js
  3. Spring Cloud Alibaba源码 - 16 Nacos 注册中心源码解析
  4. modelsim(1):经常使用的测试设计的结构
  5. Fix an “Unapproved Caller” SecurityAgent Message in Mac OS X
  6. android 搭建短信平台,Android 短信SDK集成文档 | Mob文档中心
  7. 数据结构思维 第十章 哈希
  8. mysql保存表出错1075_navicat出现错误1075怎么办
  9. Android Download 下载功能深入研究(二) : 速度提升之探索
  10. ubuntu安装英伟达显卡GT 540M驱动
  11. 站内信“数据库设计思路”
  12. linux 桌面显示 kvm,Linux的桌面虚拟化技术KVM(五)——virsh常用命令
  13. 北京个人所得税计算方法
  14. Linux内核源码高速下载地址
  15. [808]There were errors checking the update sites: SSLHandshakeException: sun.secu解决方案
  16. [转] 明年,你还爱我吗?
  17. InnoDB原理篇:聊聊数据页变成索引这件事
  18. 商家或企业做小红书种草推广具体有哪些好处?
  19. 初识JAVA,请多多关照
  20. gameboy模拟器开发_CoreBoy是使用C#编写的跨平台GameBoy模拟器,甚至可以执行ASCII

热门文章

  1. 大家都看得见学计算机的决定,卢须振二丫-图书检索系统.PDF
  2. 用matlab计算卫星的瞬时位置,用MATLAB计算GPS卫星位置.PDF
  3. python基础之内置成员和魔法函数(16)
  4. 齐家坪水电站施工组织设计(lunwen+任务书+外文翻译+cad图纸)
  5. Fragment Transactions Activity State Loss
  6. html随机出现一张图片,图片随机飘动用html怎么做
  7. 电子计算机显示屏维修,液晶显示器闪烁如何处理_液晶显示器维修教程
  8. XTM计算机辅助翻译,计算机辅助翻译原理与实践
  9. 【缺陷管理】9:偶尔出现的缺陷如何处理?
  10. 谢国忠正在走入一种非理性思维状态