准备加上一些小功能。

重新写了一下代码,先保存在这里:

import requests

import re

def first():

import sys

reload(sys)

sys.setdefaultencoding('utf-8')

def get_raw(url):

print url

headers = {'content-type': 'application/json',

'User-Agent': 'Mozilla/5.0 (X11; Ubuntu; Linux x86_64; rv:22.0) Gecko/20100101 Firefox/22.0'}

r = requests.get(url,headers=headers)

return r.text

def get_wooyun_content(raw):

p = re.compile(r'

([0-9\-]+)[^ (.*?)[^([^

content = re.findall(p,raw)

return content

def save_content(content):

with open('1.txt','w') as f:

for i in content:

item = ' * '.join(i)

# item.encode('utf-8')

print item

f.write(item+'\n')

def main():

first()

pages=1930

for i in range(pages,pages-20,-1):

url = 'http://wooyun.org/bugs/new_public/page/' + str(i)

raw = get_raw(url)

content = get_wooyun_content(raw)

save_content(content)

if __name__ == '__main__':

main()

爬虫python漏洞群_python爬虫 之 wooyun公开漏洞相关推荐

  1. 爬虫python下载电影_python爬虫:抓取下载电影文件,合并ts文件为完整视频

    目标网站:https://www.88ys.cc/vod-play-id-58547-src-1-num-1.html 反贪风暴4 对电影进行分析 我们发现,电影是按片段一点点加载出来的,我们分别抓取 ...

  2. 爬虫python名词解释_python爬虫

    Python爬虫是用Python编程语言实现的网络爬虫,主要用于网络数据的抓取和处理,相比于其他语言,Python是一门非常适合开发网络爬虫的编程语言,大量内置包,可以轻松实现网络爬虫功能. Pyth ...

  3. 爬虫python下载电影_python爬虫抓取电影天堂最新电影

    该小脚本实现对电影天堂网站的最新电影查找.from bs4 import BeautifulSoup import urllib import re url= 'http://www.ygdy8.ne ...

  4. python爬虫基础项目教程_Python爬虫开发与项目实战_Python教程

    资源名称:Python爬虫开发与项目实战 内容简介: 随着大数据时代到来,网络信息量也变得更多更大,基于传统搜索引擎的局限性,网络爬虫应运而生,本书从基本的爬虫原理开始讲解,通过介绍Pthyon编程语 ...

  5. python pipeline框架_Python爬虫从入门到放弃(十六)之 Scrapy框架中Item Pipeline用法...

    原博文 2017-07-17 16:39 − 当Item 在Spider中被收集之后,就会被传递到Item Pipeline中进行处理 每个item pipeline组件是实现了简单的方法的pytho ...

  6. python实习目的_python爬虫系列---为什么要学习爬虫

    (0)为什么要学习爬虫 最近刷抖音看到一个话题是"为什么要找程序员老公?",其中一条理由是:写个python网络投票爬虫,稳稳让自家孩子成为幼儿园最美宝宝.当然这算是爬虫的其中一个 ...

  7. python爬虫微博评论图片_python爬虫爬取微博评论

    原标题:python爬虫爬取微博评论 python爬虫是程序员们一定会掌握的知识,练习python爬虫时,很多人会选择爬取微博练手.python爬虫微博根据微博存在于不同媒介上,所爬取的难度有差异,无 ...

  8. python爬虫有多少种方式_python爬虫-----Python访问http的几种方式

    爬取页面数据,我们需要访问页面,发送http请求,以下内容就是Python发送请求的几种简单方式: 会使用到的库  urllib   requests 1.urlopen import urllib. ...

  9. python爬虫抓取房产_Python爬虫实战(3):安居客房产经纪人信息采集

    1, 引言 Python开源网络爬虫项目启动之初,我们就把网络爬虫分成两类:即时爬虫和收割式网络爬虫.为了使用各种应用场景,该项目的整个网络爬虫产品线包含了四类产品,如下图所示: 本实战是上图中的&q ...

最新文章

  1. JavaScript的编译模式
  2. [Jsp] 如何在JSP页面快速输出从Servlet接收的数据_看JSTL常用C标签的威力
  3. Java学习笔记_抽象/接口
  4. linux下不同tomcat使用不同的jdk版本
  5. 【零基础学Java】—递归(五十一)
  6. android日期选择区间控件_Android日期时间选择器实现以及自定义大小
  7. java 7 的新特性
  8. 定制clojure的REPL
  9. OneDrive更换要同步文件夹
  10. Visual FoxPro权威指南写作原稿及光盘下载
  11. f4 OF DATE FIELD IN DYNPRO PROGRAME
  12. ios怎么玩android游戏,安卓手机怎么玩ios游戏 教你打开iOS游戏
  13. 【深度学习】搭建人工智能服务网站(安全帽检测)
  14. uva 571 - Jugs
  15. oul可以用作c语言常量吗,STL chips
  16. JQuery data方法的使用-遁地龙卷风
  17. 微信支付——扫码支付模式二
  18. msec php,关于QThread::wait(msec)函数的讨论
  19. 南阳oj108--士兵杀敌(一)(线段树,求和)
  20. Windows+ubuntu1803双系统安装

热门文章

  1. 【渝粤教育】电大中专品牌管理与推广答案作业 题库
  2. 健康医疗设备拓客的10个经典方法
  3. MATLAB实现睡眠脑电分期--sleep-EDF(详细步骤和代码)
  4. 自定义列dl标签 和 del标签
  5. 迅雷去广告的方法探讨
  6. 图解Redis,Redis主从复制与Redis哨兵机制
  7. [游戏]街头霸王IV 动画视频
  8. Error on execution -version `Qt_5' not found required by
  9. python抢购火车票源代码_五一要来了,教你用Python动刷新抢12306火车票,附源码...
  10. 华中科技大学c语言报告,华中科技大学c语言实验报告