前言

本文的文字及图片来源于网络,仅供学习、交流使用,不具有任何商业用途,如有问题请及时联系我们以作处理。

还记得童年的网页小游戏吗?今天带大家爬取4399小游戏网站的数据,游戏名字+链接地址

目标网站

http://www.4399.com/

基本环境配置

  • python 3.6
  • pycharm
  • requests
  • parsel
  • csv

爬虫代码

导入需要用到的工具

1import requests
2import parsel
3import csv

请求网页

1    url = 'http://www.4399.com/flash_fl/5_{}.htm'.format(page)
2    headers = {
3        'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/81.0.4044.138 Safari/537.36'
4    }
5    response = requests.get(url=url, headers=headers)
6    response.encoding = response.apparent_encoding

解析网页,爬取数据

1    for li in lis:
2        dit ={}
3        data_url = li.css('a::attr(href)').get()
4        new_url = 'http://www.4399.com' + data_url.replace('http://', '/')
5        dit['游戏地址'] = new_url
6        title = li.css('img::attr(alt)').get()
7        dit['游戏名字'] = title
8        print(new_url, title)

保存数据

1f = open('4399游戏.csv', mode='a', encoding='utf-8-sig', newline='')
2
3csv_writer = csv.DictWriter(f, fieldnames=['游戏地址', '游戏名字'])
4csv_writer.writeheader()
5f.close()

运行代码,效果如下图

每秒200条数据,超快的爬取速度

怎么把4399小游戏的代码_25行代码带你爬取4399小游戏数据,看下童年的游戏是否还在...相关推荐

  1. python爬取4399小游戏数据_25行代码带你爬取4399小游戏数据,看下童年的游戏是否还在...

    前言 本文的文字及图片来源于网络,仅供学习.交流使用,不具有任何商业用途,如有问题请及时联系我们以作处理. 还记得童年的网页小游戏吗?今天带大家爬取4399小游戏网站的数据,游戏名字+链接地址 目标网 ...

  2. 25行代码带你爬取4399小游戏数据,看下童年的游戏是否还在

    前言 本文的文字及图片来源于网络,仅供学习.交流使用,不具有任何商业用途,如有问题请及时联系我们以作处理. 还记得童年的网页小游戏吗?今天带大家爬取4399小游戏网站的数据,游戏名字+链接地址 目标网 ...

  3. python爬斗鱼直播数据图片_Python爬取2000万直播数据——看20万游戏主播能否月入100万...

    原标题:Python爬取2000万直播数据--看20万游戏主播能否月入100万 她那时候还太年轻,不知道命运赠送的礼物,早已暗中标好了价格. --茨威格 社会在发展,时代在进步.伴随着未曾停息的拥护声 ...

  4. Python---20行代码爬取斗鱼平台房间数据(下)

    在上一篇中,已经详细的讲解了如何获取数据,接下来是深度处理数据,这里调用xlsxwriter库来制作Excel表格. 工具:Python3.6.5,Pycharm 1.模块介绍 XlsxWriter模 ...

  5. 利用python爬取飞猪信息_Python---20行代码爬取斗鱼平台房间数据(下)-阿里云开发者社区...

    在上一篇中,已经详细的讲解了如何获取数据,接下来是深度处理数据,这里调用xlsxwriter库来制作Excel表格. 工具:Python3.6.5,Pycharm 1.模块介绍 XlsxWriter模 ...

  6. python爬斗鱼直播_Python---20行代码爬取斗鱼平台房间数据(下)

    在上一篇中,已经详细的讲解了如何获取数据,接下来是深度处理数据,这里调用xlsxwriter库来制作Excel表格. 工具:Python3.6.5,Pycharm 1.模块介绍 XlsxWriter模 ...

  7. python爬斗鱼直播_Python爬取2000万直播数据——看20万游戏主播能否月入100万

    作者 | 朱小五and王小九来源 | 凹凸数读 她那时候还太年轻,不知道命运赠送的礼物,早已暗中标好了价格. --茨威格 社会在发展,时代在进步.伴随着未曾停息的拥护声和反对声,电竞行业逐渐被接受,被 ...

  8. 利用python做一个游戏主播_Python爬取2000万直播数据——看20万游戏主播能否月入100万...

    作者 | 朱小五and王小九 来源 | 凹凸数读 她那时候还太年轻,不知道命运赠送的礼物,早已暗中标好了价格. --茨威格 社会在发展,时代在进步.伴随着未曾停息的拥护声和反对声,电竞行业逐渐被接受, ...

  9. matlab计算aqi代码,AQI计算第一课,爬取全部城市AQI数据的代码一样但是只能爬出第一个城市的数据是怎么回事?...

    import requests from bs4 import BeautifulSoup def get_city_aqi(city_pinyin): """ 获取城市 ...

最新文章

  1. Linux终端命令(6)--ifconfig,(find -name ‘*.txt‘ | xargs rm -rf)
  2. 国基金评委:关键科学问题的凝练不到位,容易被评审专家“灭掉”
  3. turbo c相关文档
  4. Java 文件流操作.,互联网 面试官 如何面试
  5. Pascal 语言中的关键字及保留字
  6. Mysql:语法:标志符、关键字
  7. 怎样看pytorch源码最有效?
  8. 免费下载需付费的qq音乐/各种音乐
  9. Excel数据透视表学习
  10. 神探狄仁杰是一个Debug高手
  11. easyx带笔锋的涂鸦板!
  12. VMware收购云监控公司Wavefront
  13. 给未来写封信app服务器维护中,‎App Store 上的“给未来写封信”
  14. 手把手教你Photoshop蒙版的使用(二)
  15. 函数 单片机glint_单片机数字化资源库
  16. 《详细》使用ventoy制作linux to go和win to go放在u盘中《即走即用的便携式系统》,自带系统引导
  17. 折半查找判定树的画法(较简单易懂!)
  18. Jenkins:設定一次後就很方便的排程工具
  19. matlab内联函数怎么作图,第1讲:向量,函数和作图
  20. 解决Solaris应用程序开发内存泄漏问题 (1)

热门文章

  1. WPF自定义控件与样式(5)-Calendar/DatePicker日期控件自定义样式及扩展
  2. cacti添加I/O监控
  3. LYNC解决方案巡展
  4. Mybatis-jar-lib
  5. Jquery mobile 解决IOS9selectli闪退问题
  6. android qq登录 获取用户信息吗,免登录 只需要一个QQ号就能获取QQ头像和QQ昵称 获取QQ用户信息API...
  7. 合并排序算法排序过程_外部合并排序算法
  8. Python | Tkinter中的文本区域和按钮
  9. java随机生成1到33数组,JAVA 生成随机数数组
  10. php 随机两位小数数_使用8086微处理器找出两个8位N数数组