本文主要为大家分享一篇如何完整写一个爬虫框架的请求方法,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧,希望能帮助到大家。

产生爬虫框架:

1、建立一个scrapy爬虫工程

2、在工程中产生一个scrapy爬虫

3、配置spider爬虫

4、运行爬虫,获取网页

具体操作:

1、建立工程

定义一个工程,名称为:python123demo

方法:

在cmd中,d: 进入d盘, cd pycodes 进入文件pycodes

然后输入

scrapy startproject python123demo

在pycodes中会生成一个文件:

_init_.py不需要用户编写

2、在工程中产生一个scrapy爬虫

执行一条命令,给出爬虫名字和爬取的网站

产生爬虫:

生成一个名称为 demo 的spider

仅限生成 demo.py,其内容为:

name = 'demo' 当前爬虫名字为demo

allowed_domains = " 爬取该网站域名以下的链接,该域名由cmd命令台输入

start_urls = [] 爬取的初始页面

parse()用于处理相应,解析内容形成字典,发现新的url爬取请求

3、配置产生的spider爬虫,使之满足我们的需求

将解析的页面保存成文件

修改demo.py文件

4、运行爬虫,获取网页

打开cmd输入命令行进行爬虫

然后我的电脑上出现了一个错误

windows系统上出现这个问题的解决需要安装Py32Win模块,但是直接通过官网链接装exe会出现几百个错误,更方便的做法是

pip3 install pypiwin32

这是py3的解决方案

注意:py3版本如果用 pip install pypiwin32指令会发生错误

安装完成后,重新进行爬虫,成功!撒花!

捕获页面存储在 demo.html文件中

demo.py 所对应的完整代码:

两版本等价:

如何编写python爬虫_如何完整写一个爬虫框架相关推荐

  1. java编写日历思路_使用JAVA写一个简单的日历

    JAVA写一个简单的日历import java.text.DateFormat; import java.text.ParseException; import java.text.SimpleDat ...

  2. 编写python程序 兀 3_帮忙写一个简单的python程序π_π 要求就是图上的那样 其实挺简单的但我就是写不出来。拜托了,...

    展开全部 要求提的不是很明确,按照最简单的功能来做了. 只记录姓名和电话号码62616964757a686964616fe78988e69d8331333337626138,没有做号码检验.也没有做保 ...

  3. python可抓取数据包括什么_Python对JS型数据抓取有什么特别好的方法吗,pythonjs型抓取,想写一个爬虫,但是需要抓...

    Python对JS型数据抓取有什么特别好的方法吗,pythonjs型抓取,想写一个爬虫,但是需要抓 想写一个爬虫,但是需要抓去的的数据是js生成的,在源代码里看不到,要怎么才能抓到呢? 最好是用pyt ...

  4. 用 Python + itchat 写一个爬虫脚本每天定时给女朋友发微信暖心话

    项目介绍: 灵感来源 在掘金看到了一篇<用Node+wechaty写一个爬虫脚本每天定时给女(男)朋友发微信暖心话>后,我就想为什么不用 Python 去实现这个功能呢. JUST TO ...

  5. Storm【实践系列-如何写一个爬虫】 - ParserBolt

    2019独角兽企业重金招聘Python工程师标准>>> 阅读背景: 如果您对爬虫,或则web前端不够了解,请自行google. 代码前提:您需要参阅本ID 所写的前面两篇博文:  S ...

  6. 花三分钟给女票写一个爬虫,做一回模范男友!

    烦恼波及 女票是做运营的,一直苦恼于起推文标题.领导还会频繁突袭:"XX,给这次活动拟一个标题." tmd,自己分内的活都干不完,却要为活动策划起标题流汗,不是自己的活,还得笑着干 ...

  7. 用Node+wechaty写一个爬虫脚本每天定时给女朋友发微信暖心话

    点击上方"前端小苑",选择"置顶公众号" 精品技术文章,热门资讯第一时间送达 wechatBot 微信每日说,每日自动发送微信消息给你心爱的人 项目介绍 灵感来 ...

  8. 用Node+wechaty写一个爬虫脚本每天定时给女(男)朋友发微信暖心话

    wechatBot 微信每日说,每日自动发送微信消息给你心爱的人 项目介绍 灵感来源 在掘金看到了一篇<用Node + EJS写一个爬虫脚本每天定时女朋友发一封暖心邮件>后, 在评论区偶然 ...

  9. 从零开始写一个RPC框架的详细步骤

    http://blog.csdn.net/liu88010988/article/details/51547592 定位 所谓定位就是回答几个问题,我出于什么目的要写一个框架,我的这个框架是干什么的, ...

  10. 【RPC框架、RPC框架必会的基本知识、手写一个RPC框架案例、优秀的RPC框架Dubbo、Dubbo和SpringCloud框架比较】

    一.RPC框架必会的基本知识 1.1 什么是RPC? RPC(Remote Procedure Call --远程过程调用),它是一种通过网络从远程计算机程序上请求服务,而不需要了解底层网络的技术. ...

最新文章

  1. C# 图片旋转360度程序
  2. SQL Server 2005的服务器角色(public)的问题
  3. java通过ftp上传文件到服务器_java-通过FTP将文件传输到服务器,但结果以零...
  4. python xpath爬虫_Python爬虫(2):XPath语法
  5. c和汇编混合编程----shellcode----弹出计算器
  6. 编程之美-第3章 结构之法
  7. Java是有法_Java基础语法
  8. centos7子系统 win10_Win10下安装CentOS 7双系统详解
  9. js 正则表达式判断价格
  10. editplus更改编码
  11. 【转】Nutch源代码研究 网页抓取 数据结构
  12. android迷你世界助手52,迷你世界助手盒子刷迷你币
  13. 计算机主板电源线接法,主板电源线怎么接
  14. rabbitMq实现公平分发策略
  15. Ambari2.7.4配置HIVE_AUX_JARS_PATH
  16. 蚂蚁区块链平台BaaS技术解析与实践
  17. glm::quat 四元数,坑了一下午
  18. Quality-Estimation1 (翻译质量评价-复现 WMT2018 阿里论文结果)
  19. Numpy简易教程7——读/写文件
  20. 怎么把安卓手机便签小工具添加到手机桌面显示呢?

热门文章

  1. 一款超好用的企业级URL采集软件(Msray-plus)
  2. 专业PE优盘启动制作工具 - 优启通
  3. 刘汝佳 《竞赛入门》5.2.2
  4. realtek高清晰音频管理器没有设备高级设置怎么设置音箱与耳机同时响
  5. WAMP5配置本地服务器(超级详细教程)
  6. php用户注册审核,php 之 注册审核(0523)
  7. c语言运算符优先级表(c语言中各种运算符的优先级)
  8. LED数码管结构与工作原理
  9. mac os模拟器linux,Mac系统如何启动iOS模拟器 快速启动iOS模拟器教程
  10. 西门子触摸屏脚本程序_新手请收藏,超详细的西门子触摸屏设置与编程图文教程...