# -*- coding: utf-8 -*-
from douyu import main
import requests
import json,sys
import randomreload(sys)
sys.setdefaultencoding("utf-8")Max=165#斗鱼页数def createRandomString(len):print ('wet'.center(10,'*'))raw = ""range1 = range(58, 65) # between 0~9 and A~Zrange2 = range(91, 97) # between A~Z and a~zi = 0while i < len:seed = random.randint(48, 122)if ((seed in range1) or (seed in range2)):continue;raw += chr(seed);i += 1return rawdef getNumber():p = 0urls = ['https://www.douyu.com/gapi/rkc/directory/0_0/{}'.format(page) for page in range(1, Max)]fp=open("douyu_"+createRandomString(4)+".txt","w")fp.write("「斗鱼」\n")for url in urls:res = requests.get(url)j = json.loads(res.text)l1 = j['data']l2 = l1['rl']p = p+1fp.write("==第%d页==\n"% p)for i in range(len(l2)):Anchor = l2[i]['nn']            RoomNumber = l2[i]['rid']        print Anchor+","+main(RoomNumber)+"\n"if not "未开播" in main(RoomNumber):fp.write(Anchor+","+main(RoomNumber)+"\n")fp.write("\n")fp.close()print(u'斗鱼房间数据已保存')getNumber()



cmd加入显示直播源;
txt加入分页,每120条数据为一页,最后一页除外;

main模块请看上一篇

爬取斗鱼所有房间及直播源相关推荐

  1. python爬斗鱼直播_Python---20行代码爬取斗鱼平台房间数据(下)

    在上一篇中,已经详细的讲解了如何获取数据,接下来是深度处理数据,这里调用xlsxwriter库来制作Excel表格. 工具:Python3.6.5,Pycharm 1.模块介绍 XlsxWriter模 ...

  2. Python---20行代码爬取斗鱼平台房间数据(下)

    在上一篇中,已经详细的讲解了如何获取数据,接下来是深度处理数据,这里调用xlsxwriter库来制作Excel表格. 工具:Python3.6.5,Pycharm 1.模块介绍 XlsxWriter模 ...

  3. 利用python爬取飞猪信息_Python---20行代码爬取斗鱼平台房间数据(下)-阿里云开发者社区...

    在上一篇中,已经详细的讲解了如何获取数据,接下来是深度处理数据,这里调用xlsxwriter库来制作Excel表格. 工具:Python3.6.5,Pycharm 1.模块介绍 XlsxWriter模 ...

  4. python爬虫:使用selenium、unittest和BeautifulSoup爬取斗鱼tv的当前直播人数

    import unittest from selenium import webdriver from bs4 import BeautifulSoup as bsclass douyu(unitte ...

  5. Python---20行代码爬取斗鱼平台房间数据(上)

    本期用到json,requests库来爬取网页信息,这次爬的是一个特殊多页式网站,普通多页式网站只需分析不同页面的url,找出其中的不同点,用for in来循环即可,但是斗鱼的https://www. ...

  6. python房子代码,Python---20行代码爬取斗鱼平台房间数据(上)

    本期用到json,requests库来爬取网页信息,这次爬的是一个特殊多页式网站,普通多页式网站只需分析不同页面的url,找出其中的不同点,用for in来循环即可,但是斗鱼的https://www. ...

  7. 利用selenium爬取斗鱼漂亮小姐姐直播间信息

    斗鱼 - selenium 思路 源代码 斗鱼 - selenium 更 多 爬 虫 教 程 请 移 步 \color{red}更多爬虫教程请移步 更

  8. 使用selenium自动爬取斗鱼直播平台的所有房间信息

    使用selenium自动爬取斗鱼直播平台的所有房间信息 文章目录 使用selenium自动爬取斗鱼直播平台的所有房间信息 使用selenium实现动态页面模拟点击 什么是selenium? selen ...

  9. 实时爬取斗鱼直播时的弹幕消息

    最近想爬取实时消息,上网查了下,所以爬取斗鱼直播的弹幕消息做了下练习,这个开源的代码有很多,但是具体是怎么爬取到的还是要仔细地研究下.想爬取斗鱼的弹幕消息,按照常用的做法是打开网页用抓包工具抓包,但是 ...

  10. Python爬取斗鱼直播网站信息

    一.需求 爬取斗鱼直播网站信息,如直播名字.主播名字.热度.图片和房间网址,将这些数据保存到csv文件中,并单独创建文件夹保存图片. 斗鱼直播网址:https://www.douyu.com/g_LO ...

最新文章

  1. 用python绘制柱状图标题-Python数据可视化:5种绘制柱状图表的方法(附源码)...
  2. QTP之对测试用例的自动化过程的分解
  3. VTK:PolyData之Stripper
  4. rabbitmq怎么停止_如何停止从选择性队列中消费消息 – RabbitMQ
  5. BZOJ2648 SJY摆棋子(KD-Tree)
  6. python什么元素为真_如何使用Python基础内置函数
  7. 抖音封杀小猪佩奇,一年赚100亿的“社会人”得罪了谁?
  8. Vue小案例 之 商品管理------创建页面与部分数据
  9. vue 获取数组索引_获取某个数组元素 在 数组中的索引
  10. 在Eclipse/MyEclipse中安装spket插件
  11. 波卡生态DAO基础设施完成150万美元战略融资
  12. 32位/64位WIN2003各版本支持内存列表 彻底解决XP系统无法支持4G内存的问题
  13. 内存管理-基础知识框架和关键结构体(一)
  14. ansys18.0安装教程
  15. centos改变文件拥有者_linux修改文件所有者和文件所在组
  16. wordcloud绘制词云图的方法
  17. matlab初值随机扰动,GRAPES区域集合预报系统模式不确定性的随机扰动技术研究
  18. steam怎么共享计算机游戏,steam怎么共享游戏给好友?steam向好友共享游戏教程
  19. QQ服务器Ip用于文件传输,QQ文件传输协议
  20. bzoj 3772: 精神污染 (主席树+dfs序)

热门文章

  1. DPDK-VPP 学习笔记-01
  2. 远程桌面凭据无法工作
  3. C++和MFC的常用总结
  4. Entry输入框实现登录用户名冷却验证小案例(Tkinter)
  5. 计算机软件版本号是什么意思,带你深入了解解密Windows系统版本和版本号
  6. android opencl sdk,在新的Android Studio中使用OpenCL
  7. 单片机io取反c语言,【51单片机】普通I/O口模拟SPI口C语言程序
  8. 用友NC6.5 ,NC6.33,NC 6.3最新补丁下载
  9. 《MySQL技术内幕》读书笔记
  10. 单片机c语言案例教程,单片机C语言案例教程