怎么把4399小游戏的代码_25行代码带你爬取4399小游戏数据,看下童年的游戏是否还在...
前言
本文的文字及图片来源于网络,仅供学习、交流使用,不具有任何商业用途,如有问题请及时联系我们以作处理。
还记得童年的网页小游戏吗?今天带大家爬取4399小游戏网站的数据,游戏名字+链接地址
目标网站
http://www.4399.com/
基本环境配置
- python 3.6
- pycharm
- requests
- parsel
- csv
爬虫代码
导入需要用到的工具
1import requests
2import parsel
3import csv
请求网页
1 url = 'http://www.4399.com/flash_fl/5_{}.htm'.format(page)
2 headers = {
3 'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/81.0.4044.138 Safari/537.36'
4 }
5 response = requests.get(url=url, headers=headers)
6 response.encoding = response.apparent_encoding
解析网页,爬取数据
1 for li in lis:
2 dit ={}
3 data_url = li.css('a::attr(href)').get()
4 new_url = 'http://www.4399.com' + data_url.replace('http://', '/')
5 dit['游戏地址'] = new_url
6 title = li.css('img::attr(alt)').get()
7 dit['游戏名字'] = title
8 print(new_url, title)
保存数据
1f = open('4399游戏.csv', mode='a', encoding='utf-8-sig', newline='')
2
3csv_writer = csv.DictWriter(f, fieldnames=['游戏地址', '游戏名字'])
4csv_writer.writeheader()
5f.close()
运行代码,效果如下图
每秒200条数据,超快的爬取速度
怎么把4399小游戏的代码_25行代码带你爬取4399小游戏数据,看下童年的游戏是否还在...相关推荐
- python爬取4399小游戏数据_25行代码带你爬取4399小游戏数据,看下童年的游戏是否还在...
前言 本文的文字及图片来源于网络,仅供学习.交流使用,不具有任何商业用途,如有问题请及时联系我们以作处理. 还记得童年的网页小游戏吗?今天带大家爬取4399小游戏网站的数据,游戏名字+链接地址 目标网 ...
- 25行代码带你爬取4399小游戏数据,看下童年的游戏是否还在
前言 本文的文字及图片来源于网络,仅供学习.交流使用,不具有任何商业用途,如有问题请及时联系我们以作处理. 还记得童年的网页小游戏吗?今天带大家爬取4399小游戏网站的数据,游戏名字+链接地址 目标网 ...
- python爬斗鱼直播数据图片_Python爬取2000万直播数据——看20万游戏主播能否月入100万...
原标题:Python爬取2000万直播数据--看20万游戏主播能否月入100万 她那时候还太年轻,不知道命运赠送的礼物,早已暗中标好了价格. --茨威格 社会在发展,时代在进步.伴随着未曾停息的拥护声 ...
- Python---20行代码爬取斗鱼平台房间数据(下)
在上一篇中,已经详细的讲解了如何获取数据,接下来是深度处理数据,这里调用xlsxwriter库来制作Excel表格. 工具:Python3.6.5,Pycharm 1.模块介绍 XlsxWriter模 ...
- 利用python爬取飞猪信息_Python---20行代码爬取斗鱼平台房间数据(下)-阿里云开发者社区...
在上一篇中,已经详细的讲解了如何获取数据,接下来是深度处理数据,这里调用xlsxwriter库来制作Excel表格. 工具:Python3.6.5,Pycharm 1.模块介绍 XlsxWriter模 ...
- python爬斗鱼直播_Python---20行代码爬取斗鱼平台房间数据(下)
在上一篇中,已经详细的讲解了如何获取数据,接下来是深度处理数据,这里调用xlsxwriter库来制作Excel表格. 工具:Python3.6.5,Pycharm 1.模块介绍 XlsxWriter模 ...
- python爬斗鱼直播_Python爬取2000万直播数据——看20万游戏主播能否月入100万
作者 | 朱小五and王小九来源 | 凹凸数读 她那时候还太年轻,不知道命运赠送的礼物,早已暗中标好了价格. --茨威格 社会在发展,时代在进步.伴随着未曾停息的拥护声和反对声,电竞行业逐渐被接受,被 ...
- 利用python做一个游戏主播_Python爬取2000万直播数据——看20万游戏主播能否月入100万...
作者 | 朱小五and王小九 来源 | 凹凸数读 她那时候还太年轻,不知道命运赠送的礼物,早已暗中标好了价格. --茨威格 社会在发展,时代在进步.伴随着未曾停息的拥护声和反对声,电竞行业逐渐被接受, ...
- matlab计算aqi代码,AQI计算第一课,爬取全部城市AQI数据的代码一样但是只能爬出第一个城市的数据是怎么回事?...
import requests from bs4 import BeautifulSoup def get_city_aqi(city_pinyin): """ 获取城市 ...
最新文章
- Linux终端命令(6)--ifconfig,(find -name ‘*.txt‘ | xargs rm -rf)
- 国基金评委:关键科学问题的凝练不到位,容易被评审专家“灭掉”
- turbo c相关文档
- Java 文件流操作.,互联网 面试官 如何面试
- Pascal 语言中的关键字及保留字
- Mysql:语法:标志符、关键字
- 怎样看pytorch源码最有效?
- 免费下载需付费的qq音乐/各种音乐
- Excel数据透视表学习
- 神探狄仁杰是一个Debug高手
- easyx带笔锋的涂鸦板!
- VMware收购云监控公司Wavefront
- 给未来写封信app服务器维护中,App Store 上的“给未来写封信”
- 手把手教你Photoshop蒙版的使用(二)
- 函数 单片机glint_单片机数字化资源库
- 《详细》使用ventoy制作linux to go和win to go放在u盘中《即走即用的便携式系统》,自带系统引导
- 折半查找判定树的画法(较简单易懂!)
- Jenkins:設定一次後就很方便的排程工具
- matlab内联函数怎么作图,第1讲:向量,函数和作图
- 解决Solaris应用程序开发内存泄漏问题 (1)
热门文章
- WPF自定义控件与样式(5)-Calendar/DatePicker日期控件自定义样式及扩展
- cacti添加I/O监控
- LYNC解决方案巡展
- Mybatis-jar-lib
- Jquery mobile 解决IOS9selectli闪退问题
- android qq登录 获取用户信息吗,免登录 只需要一个QQ号就能获取QQ头像和QQ昵称 获取QQ用户信息API...
- 合并排序算法排序过程_外部合并排序算法
- Python | Tkinter中的文本区域和按钮
- java随机生成1到33数组,JAVA 生成随机数数组
- php 随机两位小数数_使用8086微处理器找出两个8位N数数组