python 3爬取斗鱼某些版块的主播人气

1.爬虫版块

import Test3

import urllib.request

from bs4 import BeautifulSoup

import json

def Reptilian(url):

#添加头部,伪装浏览器

headers = {

'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/55.0.2883.103 Safari/537.36'}

resquest = urllib.request.Request(url=url, headers=headers)

response = urllib.request.urlopen(resquest)

if response.code == 200:

print("服务器连接成功")

#读取数据

data = response.read()

html = data.decode('utf-8')

#解析器

soup = BeautifulSoup(

html,

'html.parser',

from_encoding='utf-8'

)

links1 = soup.find_all('span', class_="dy-name ellipsis fl") #主播的名字

links2 = soup.find_all('span', class_="dy-num fr") # 主播的人气

#数据插入到数据库

for i in range(0,120):#暂时只爬取了第一个,一页有120条数据

Test3.mysqldb(links1[i].get_text(),links2[i].get_text())

if __name__=="__main__":

url = "https://www.douyu.com/directory/game/LOL"#爬取地址,这里爬取的是斗鱼DNF版块的

Reptilian(url)

2.插入数据库版块

import pymysql

#插入数据到数据库

def mysqldb(name,renqi):

db = pymysql.connect(host='localhost',

port=3306,

user='root',

passwd='root',

db='testinfo',

charset='utf8')

cursor = db.cursor()

name1="'"+name+"'"

renqi1="'"+renqi+"'"

sql="INSERT into renqiinfo(id,name,renqi) VALUES(1,%s,%s)"%(name1,renqi1)

print(sql)

cursor.execute(sql)

db.commit()

运行代码截图如下

3.查询数据库版块

import pymysql

#查询入库的数据

def mysqldb():

db = pymysql.connect(host='localhost',

port=3306,

user='root',

passwd='root',

db='testinfo',

charset='utf8')

cursor = db.cursor()

sql = """select * from renqiinfo"""

cursor.execute(sql)

results = cursor.fetchall();

return results

if __name__=="__main__":

results=mysqldb()

for row in results:

print("id:"+str(row[0]))

print("name:" + row[1])

print("renqi:" + row[2])

print()

运行代码截图如下

3.总结

后续还会添加新的功能:

1.例如分页爬取,把版块所有的主播信息都爬取下来.

2.代理爬虫,绕开网站的反爬虫

3.多线程,同时爬取多个网站

4.定时爬虫,间隔多长时间爬取网站

python爬斗鱼直播房间名和主播名_python3爬取斗鱼某些版块的主播人气相关推荐

  1. 使用seleniumphantomjs+bs4抓取斗鱼直播房间信息

    使用selenium&phantomjs+bs4抓取斗鱼直播房间信息 # -*- coding:utf-8 -*-from selenium import webdriver from bs4 ...

  2. python爬斗鱼直播房间名和主播名_斗鱼爬虫,爬取颜值频道的主播图片和名字

    在斗鱼的界面中,如果滚动条没有拉下去,那么下面的图片都只是一条鱼的图片,所以要使浏览器自动拉动滚动条,可以用到python的selenium库, 1.配置浏览器 要使用selenium,还需要安装 c ...

  3. 经典爬虫学习(四)-selsenium实现斗鱼直播房间信息爬取

    本案例中通过两种不同的selenium作用实现了对斗鱼直播平台的房间信息进行多页爬取. selenium实现信息爬取以及页面跳转功能 selenium实现页面跳转功能,lxml解析库实现数据爬取功能 ...

  4. 基于selenium的斗鱼直播房间详细信息自动化爬虫

    from selenium import webdriver import time #导入 ActionChains 类 from selenium.webdriver import ActionC ...

  5. python 使用selenium爬取斗鱼直播房间信息

    用到的模块 今天没课,开启正片 selenium 打开浏览器提取数据 time 每打开一个页面睡眠几秒,防止太快报错还有被发现 json 写入文件要用到 完整代码如下(为了减少代码就不使用类了) fr ...

  6. 实现sohu社区′只看楼主′的功能,抓取连载帖子中楼主的所有帖子

    sohu社区(http://club.sohu.com/main.php),经常有一些不错的连载的帖子,少则几千个回复,多则可以上万个,可是最有用最想看的楼主的帖子也就几十个,从这些成千上万的帖子中, ...

  7. 斗鱼直播弹幕python_python利用danmu实时获取斗鱼等直播网站字幕

    danmu 是一个开源的直播平台弹幕接口 用python    pip install danmu # -*- coding: utf-8 -*- import time, sys from danm ...

  8. 机器学习 | 斗鱼直播热度影响因素分析

    斗鱼直播热度影响因素分析 1 报告来源 2 思路 3 PPT分享 1 报告来源 上学期导师课<商务大数据分析>团队一起完成的数据分析报告,PPT和大家分享一下. 2 思路 完成作品&quo ...

  9. 辰辰用计算机算出年龄,斗鱼直播艾辰辰啊年龄作品资料介绍 艾辰辰怎么火起来的...

    斗鱼直播艾辰辰啊凭借一首<来不及说再见>一炮走红网络,唱歌确实非常的好听.那么斗鱼直播艾辰辰啊是谁真名叫什么资料介绍.下面来看一下. 斗鱼直播艾辰辰啊是谁个人资料介绍 真实姓名:未知 微博 ...

  10. win7服务器系统很卡,win7系统看斗鱼直播很卡的解决方法

    很多小伙伴都遇到过win7系统看斗鱼直播很卡的困惑吧,一些朋友看过网上零散的win7系统看斗鱼直播很卡的处理方法,并没有完完全全明白win7系统看斗鱼直播很卡是如何解决的,今天小编准备了简单的解决办法 ...

最新文章

  1. FMDatabaseQueue 数据库多线程操作、事务处理
  2. 计算机应用基础2016高起专,计算机应用基础-2016年秋季《计算机应用基础(高起专)》期末考核(20210407163441).pdf...
  3. Android DatePicker, TimePicker控件的使用
  4. 迷宫游戏c语言代码讲解,迷宫游戏C语言代码讲解.doc
  5. ROS入门-11.客户端Client的编程实现
  6. Xamarin 打包生成 Android apk 文件
  7. 网工学Python——初识函数
  8. qq2008珊瑚虫版SL
  9. hadoop部分架构图
  10. Silverlight 2.5D RPG游戏技巧与特效处理:纸娃娃系统
  11. 一、linux驱动实验-14.1-imx6ull驱动MT7601
  12. oracle19c报价_Oracle 19C EM
  13. Arduino Uno ADS1115 数模转换
  14. C语言程序设计现代方法-第二版-第10章练习题
  15. vue 项目打包后可以改为动态配置域名地址
  16. 软件配置管理概念-3,CM系统的概念
  17. python打开是什么颜色-Python中常见颜色记录
  18. 如何将数据导入python
  19. 使用TWRP Recovery刷入CM13等第三方ROM教程
  20. 【51单片机】 ULN2003模块 驱动步进电机(5线)正反转 代码以及接线图(简单教学,一看就会)

热门文章

  1. 腾讯游戏客户端一面准备
  2. linux设置硬盘启动顺序,电脑双硬盘双系统启动的顺序调整及设置方法
  3. 微信小程序分享功能知识点
  4. 传奇人物____Anders Hejlsberg
  5. c语言速算24课程设计,C语言速算24数据结构课程设计.doc
  6. C#中问号“?”的用法
  7. 创业起步 中小型网吧的组建解决方案(转)
  8. 计算机毕业设计HTML+CSS+JavaScript仿大型购物商城(1页)
  9. 基于Python图书馆座位预约系统设计与实现 开题报告
  10. 3DES加密,苹果、Java 、安卓 平台一致的加密工具