爬虫python漏洞群_python爬虫 之 wooyun公开漏洞
准备加上一些小功能。
重新写了一下代码,先保存在这里:
import requests
import re
def first():
import sys
reload(sys)
sys.setdefaultencoding('utf-8')
def get_raw(url):
print url
headers = {'content-type': 'application/json',
'User-Agent': 'Mozilla/5.0 (X11; Ubuntu; Linux x86_64; rv:22.0) Gecko/20100101 Firefox/22.0'}
r = requests.get(url,headers=headers)
return r.text
def get_wooyun_content(raw):
p = re.compile(r'
([0-9\-]+)[^ (.*?)[^([^
content = re.findall(p,raw)
return content
def save_content(content):
with open('1.txt','w') as f:
for i in content:
item = ' * '.join(i)
# item.encode('utf-8')
print item
f.write(item+'\n')
def main():
first()
pages=1930
for i in range(pages,pages-20,-1):
url = 'http://wooyun.org/bugs/new_public/page/' + str(i)
raw = get_raw(url)
content = get_wooyun_content(raw)
save_content(content)
if __name__ == '__main__':
main()
爬虫python漏洞群_python爬虫 之 wooyun公开漏洞相关推荐
- 爬虫python下载电影_python爬虫:抓取下载电影文件,合并ts文件为完整视频
目标网站:https://www.88ys.cc/vod-play-id-58547-src-1-num-1.html 反贪风暴4 对电影进行分析 我们发现,电影是按片段一点点加载出来的,我们分别抓取 ...
- 爬虫python名词解释_python爬虫
Python爬虫是用Python编程语言实现的网络爬虫,主要用于网络数据的抓取和处理,相比于其他语言,Python是一门非常适合开发网络爬虫的编程语言,大量内置包,可以轻松实现网络爬虫功能. Pyth ...
- 爬虫python下载电影_python爬虫抓取电影天堂最新电影
该小脚本实现对电影天堂网站的最新电影查找.from bs4 import BeautifulSoup import urllib import re url= 'http://www.ygdy8.ne ...
- python爬虫基础项目教程_Python爬虫开发与项目实战_Python教程
资源名称:Python爬虫开发与项目实战 内容简介: 随着大数据时代到来,网络信息量也变得更多更大,基于传统搜索引擎的局限性,网络爬虫应运而生,本书从基本的爬虫原理开始讲解,通过介绍Pthyon编程语 ...
- python pipeline框架_Python爬虫从入门到放弃(十六)之 Scrapy框架中Item Pipeline用法...
原博文 2017-07-17 16:39 − 当Item 在Spider中被收集之后,就会被传递到Item Pipeline中进行处理 每个item pipeline组件是实现了简单的方法的pytho ...
- python实习目的_python爬虫系列---为什么要学习爬虫
(0)为什么要学习爬虫 最近刷抖音看到一个话题是"为什么要找程序员老公?",其中一条理由是:写个python网络投票爬虫,稳稳让自家孩子成为幼儿园最美宝宝.当然这算是爬虫的其中一个 ...
- python爬虫微博评论图片_python爬虫爬取微博评论
原标题:python爬虫爬取微博评论 python爬虫是程序员们一定会掌握的知识,练习python爬虫时,很多人会选择爬取微博练手.python爬虫微博根据微博存在于不同媒介上,所爬取的难度有差异,无 ...
- python爬虫有多少种方式_python爬虫-----Python访问http的几种方式
爬取页面数据,我们需要访问页面,发送http请求,以下内容就是Python发送请求的几种简单方式: 会使用到的库 urllib requests 1.urlopen import urllib. ...
- python爬虫抓取房产_Python爬虫实战(3):安居客房产经纪人信息采集
1, 引言 Python开源网络爬虫项目启动之初,我们就把网络爬虫分成两类:即时爬虫和收割式网络爬虫.为了使用各种应用场景,该项目的整个网络爬虫产品线包含了四类产品,如下图所示: 本实战是上图中的&q ...
最新文章
- JavaScript的编译模式
- [Jsp] 如何在JSP页面快速输出从Servlet接收的数据_看JSTL常用C标签的威力
- Java学习笔记_抽象/接口
- linux下不同tomcat使用不同的jdk版本
- 【零基础学Java】—递归(五十一)
- android日期选择区间控件_Android日期时间选择器实现以及自定义大小
- java 7 的新特性
- 定制clojure的REPL
- OneDrive更换要同步文件夹
- Visual FoxPro权威指南写作原稿及光盘下载
- f4 OF DATE FIELD IN DYNPRO PROGRAME
- ios怎么玩android游戏,安卓手机怎么玩ios游戏 教你打开iOS游戏
- 【深度学习】搭建人工智能服务网站(安全帽检测)
- uva 571 - Jugs
- oul可以用作c语言常量吗,STL chips
- JQuery data方法的使用-遁地龙卷风
- 微信支付——扫码支付模式二
- msec php,关于QThread::wait(msec)函数的讨论
- 南阳oj108--士兵杀敌(一)(线段树,求和)
- Windows+ubuntu1803双系统安装
热门文章
- 【渝粤教育】电大中专品牌管理与推广答案作业 题库
- 健康医疗设备拓客的10个经典方法
- MATLAB实现睡眠脑电分期--sleep-EDF(详细步骤和代码)
- 自定义列dl标签 和 del标签
- 迅雷去广告的方法探讨
- 图解Redis,Redis主从复制与Redis哨兵机制
- [游戏]街头霸王IV 动画视频
- Error on execution -version `Qt_5' not found required by
- python抢购火车票源代码_五一要来了,教你用Python动刷新抢12306火车票,附源码...
- 华中科技大学c语言报告,华中科技大学c语言实验报告