#coding=utf-8
#爬取4399所有好玩的游戏
import re
import os
import requests# 基础url
host_url = 'http://www.4399.com'
swfbase_url = 'http://sda.4399.com/4399swf'
hw_url = 'http://www.4399.com/flash/gamehw.htm'if not os.path.exists('./swf'):os.mkdir(r'./swf')# 需要的正则表达式
tmp_pat = re.compile(r'<ul class="tm_list">(.*?)</ul>',re.S)
game_pat = re.compile( r'<li><a href="(/flash.*?)"><img alt=.*?src=".*?"><b>(.*?)</b>.*?</li>', re.S )
swf_pat = re.compile(r'_strGamePath="(.*?swf)"',re.S)game_html = requests.get(hw_url)
game_html.encoding = 'gb2312'tt = tmp_pat.search(game_html.text,re.S).group(1)game_list = game_pat.findall(tt)for l in game_list:# print l[0], l[1]game_page = requests.get(host_url + l[0]).textsrc_url = swf_pat.search(game_page)if src_url == None:continue;src = requests.get( swfbase_url + src_url.group(1) ).contentprint ("正在保存游戏:" , l[1] )open( "./swf/"+ l[1] + ".swf", "wb" ).write( src )

转载于:https://www.cnblogs.com/N-S-P/p/11520534.html

Python爬取4399好wan的小游戏!相关推荐

  1. python爬取4399小游戏数据_Python爬取4399好wan的小游戏!

    #coding=utf-8 #爬取4399所有好玩的游戏 import re import os import requests # 基础url host_url = 'http://www.4399 ...

  2. python爬取4399页面

    提示:该段代码只可爬取4399页面的代码和图片,适合新手爬虫入门学习 python爬取4399页面 代码 总结 代码 代码如下: import urllib.request import re imp ...

  3. python爬取4399小游戏数据_25行代码带你爬取4399小游戏数据,看下童年的游戏是否还在...

    前言 本文的文字及图片来源于网络,仅供学习.交流使用,不具有任何商业用途,如有问题请及时联系我们以作处理. 还记得童年的网页小游戏吗?今天带大家爬取4399小游戏网站的数据,游戏名字+链接地址 目标网 ...

  4. 4399小游戏童年的乐趣,python爬取4399全站小游戏

    大家好,我是辣条. 前言 2021年已到尾巴尖尖了. 今天照镜子,看着镜子中的自己,发现还是跟年轻时一样的"帅",看到头部的时候又发现相比半个月之前的发际线,它好像又往上移了一点点 ...

  5. python爬取无水印抖音小姐姐视频(2018最新,含Pyqt客户端)

    各位小伙伴,之前一段时间迷上了抖音小姐姐视频,但是下载的视频都有水印,于是自己用Python 写了个爬取小姐姐视频的工具,大家可以直接拷贝到自己编译器上运行.此外,我还利用pyqt5写了个操作界面,这 ...

  6. python爬取网页汉字_程序小技巧:Python3借助requests类库3行代码爬取网页数据!快来...

    爬取网页数据是python很长干的一件事情,不过做起来基本上都是很冗长的一段代码,看起来复杂,不宜理解.今天给大家分享一个小诀窍,利用python3中的requests类库进行爬取网页数据. 我们先看 ...

  7. python爬取网页教程(一个小案例分享)

    一.为什么需要用爬虫? 为其他程序提供数据源,如搜索引擎(百度.Google等).数据分析.大数据等等. 二.python爬虫设计思路 1.首先确定需要爬取的网页URL地址 : 2.通过HTTP协议来 ...

  8. 用python爬取网上的睡前小故事,然后每天给女票发。哈哈哈

    今天看了有人用python爬故事,给女票每天发邮箱过去.看了一下感觉很棒,然后又看了评论,有说要是发微信就更好了. 所以...... 我就做了一个发微信的,哈哈. 先上结果 www.tom61.com ...

  9. python爬取4399小游戏数据_4399小游戏童年的乐趣,python爬取4399全站小游戏

    前言 本文的文字及图片来源于网络,仅供学习.交流使用,不具有任何商业用途,如有问题请及时联系我们以作处理. PS:如有需要Python学习资料的小伙伴可以加点击下方链接自行获取 基本环境配置pytho ...

最新文章

  1. linux二进制文件构建mysql_MySQL安装系列:使用通用二进制文件在Unix/Linux安装
  2. spring security之httpSecurity使用示例
  3. idea插件sonar字体背景颜色修改
  4. linux shell脚本中 if 条件判断
  5. 西威变频器avo下载调试资料_全程图解变频器应用与检测技能
  6. 前后端分离 获取客户端ip_前后端分离交互
  7. 阿里企业邮箱产品优势、功能、版本介绍
  8. 水果店经营策略技巧汇总,第一次开一家水果店怎么经营
  9. python字体有哪些_python字体推荐 python编程100例
  10. 基于Redis GEO(地理位置) 实现附近的人,商家等相关功能实现 使用SpringBoot Redis工具类
  11. 销售如何维护客情关系 销售维护客户有什么方法
  12. Arduino UNO控制带AB相磁通量式编码器电动推杆(测试阻尼)实录(L289N电机驱动)
  13. 什么是拦截器?什么是过滤器?
  14. swift开发之pop动画
  15. 【linux】解决设置CentOS7虚拟机使用静态IP的常见错误解决方案
  16. Docker 镜像构建可以分享的快乐
  17. 第15课:郭盛华课程_VB编程之图形与图像控件的使用方法
  18. 紧急迫降华盛顿——UA897空中事故亲历
  19. MySQL使用工具软件下载
  20. 《简单的逻辑学》读书笔记

热门文章

  1. linux/docker个人服务器项目中文变问号??,时间差8小时问题解决方法,最新,最有效
  2. 2022-2028年中国钽酸锂单晶行业市场调查分析及投资发展潜力报告
  3. Python 标准库之 subprocesss
  4. Redis 高级特性(4)— 单线程架构
  5. 并发 vs 并行 (Concurrency Is Not Parallelism)
  6. LeetCode简单题之基于排列构建数组
  7. MLIR: Infrastructure架构
  8. GPU端到端目标检测YOLOV3全过程(下)
  9. 2021年大数据常用语言Scala(十六):基础语法学习 列表 List 重点掌握
  10. 2021年大数据Spark(一):框架概述