我是初学者,请多多指教!!!


今天我做了一个爬虫程序,现在介绍一下。

urllib是一个第三方python模块需自行安装!!!

安装完模块后,首先先引入模块

from urllib import request

然后创建url变量

url="网站全称"

随后爬取网站使用,data变量保存

data=request.urlopen(url).read()
a=(data.decode())

输出为源代码(txt文件)

file=open(r"0403.txt","a")#路径为程序所在路径

输出为网页(可能不稳定)

file=open(r"0403.html","wb")#路径为程序所在路径

写入文件

file.write(a)

关闭文件

file.close()

全部代码

#请勿爬取他人的网站
#---------------------------------------------------
from urllib import request
url="网站全称"
data=request.urlopen(url).read()
a=(data.decode())
file=open(r"0403.txt","a")#路径为程序所在路径(纯文本文件)
file2=open(r"0403.html","wb")#路径为程序所在路径(网页,有时不稳定)
file.write(a)
file.close()
file2.write(a)
file2.close()
#---------------------------------------------------

谢谢指导!

python爬虫程序相关推荐

  1. python爬取换页_一个可识别翻页的简易Python爬虫程序

    同学拿出一个需求:从某课程教学网站上爬取所有课程的主页面,以及课程简介栏目内容. 于是在之前做的那个练手级的Python爬虫程序中进行修改,最终实现了该功能.与之前那个爬虫不同,这里每一个大类的课程下 ...

  2. 一个简单的python爬虫程序

    #简介 在每次论文被拒再投的过程中,都需要查询最近的与自己论文相关的会议列表.每到这种情况,我一遍采用的是遍历会伴www.myhuiban.com的网站,然后逐个查看会议,关注的有三点,投稿日期,cc ...

  3. php运行python爬虫_群晖系统中运行python爬虫程序

    重要:本文最后更新于2021-01-28 17:02:43,某些文章具有时效性,若有错误或已失效,请在下方留言或联系代码狗. 准备入手一台NAS,事先的学习是必须的,今天在VM虚拟机中安装好NAS后, ...

  4. Python 异步,协程,学起来好头疼,Python爬虫程序能调用GPU去爬东西吗?

    78 技术人社群日报时间 文章目录 Python 爬虫程序能调用 GPU 去爬东西吗? Python 异步,协程--,学起来好头疼 有没有牛子大的说下 `matplotlib` 里 `plot` 和 ...

  5. python爬虫程序说明_Python即时网络爬虫:API说明

    API说明--下载gsExtractor内容提取器 1,接口名称 下载内容提取器 2,接口说明 如果您想编写一个网络爬虫程序,您会发现大部分时间耗费在调测网页内容提取规则上,不讲正则表达式的语法如何怪 ...

  6. python爬虫流程-Python爬虫程序架构和运行流程原理解析

    1 前言 Python开发网络爬虫获取网页数据的基本流程为: 发起请求 通过URL向服务器发起request请求,请求可以包含额外的header信息. 获取响应内容 服务器正常响应,将会收到一个res ...

  7. python爬虫程序requests采用get和post方式

    第1个爬虫程序: main.py #! python # -*- coding: utf-8 -*- from urllib.request import urlopen url = "ht ...

  8. python爬虫程序下载_Python爬虫之多线程下载程序类电子书

    近段时间,笔者发现一个神奇的网站:http://www.allitebooks.com/ ,该网站提供了大量免费的编程方面的电子书,是技术爱好者们的福音.其页面如下: ![](https://imag ...

  9. python爬虫程序-Python网络爬虫实战(一)快速入门

    本系列从零开始阐述如何编写Python网络爬虫,以及网络爬虫中容易遇到的问题,比如具有反爬,加密的网站,还有爬虫拿不到数据,以及登录验证等问题,会伴随大量网站的爬虫实战来进行. 我们编写网络爬虫最主要 ...

  10. python爬虫程序实例-10个python爬虫入门实例

    作者:h3zh1 来源:cnblogs.com/h3zh1/p/12548946.html 今天为大家准备了几个简单的python爬虫入门实例,分享给大家. 涉及主要知识点:web是如何交互的 req ...

最新文章

  1. java中遍历Map对象的四种方式
  2. “面向未来,有效保护”——深信服安全理念详解
  3. 存储过程Procedure
  4. es审计日志_审计系统的一剂良方——事件溯源
  5. 电脑开机,总需要按F1,是什么原因造成的?
  6. PL-SLAM Real-time monocular visual SLAM with points and lines
  7. CListCtrl使用方法
  8. Oracle 树操作、递归查询(select…start with…connect by…prior)
  9. java虚拟机相关知识点(全网最全)
  10. 腾讯地图获取经纬度 Java计算距离工具类
  11. 宝塔面板+小鸟云服务器+wordpress建站使用
  12. 使用font-face艺术字失效
  13. 机器学习笔记(3.1)
  14. 利用Python实现摄像头实时换脸
  15. Pandas数据可视化原来也这么厉害!
  16. AS3使用,播放声音和加载外部声音文件
  17. VS2022 Visual Studio 2022专业版全功能离线版下载
  18. 什么是Hibernate方言和方言列表
  19. VC++网络安全编程范例(1)--数字证书有效期验证
  20. 计算机验证型数学实验报告,数学建模实验报告1.doc

热门文章

  1. java dojo,针对 Java 开发人员的 Dojo 概念
  2. 达拉斯大学计算机硕士专业排名,德克萨斯大学达拉斯分校UTD计算机科学Computer Science专业排名第251-300位(2021年THE世界大学商科排名)...
  3. python 获取 淘宝 app 数据_python-爬取app上数据
  4. 电子书PDF文件的压缩实践
  5. 九鼎无双一面面经【凉】
  6. Pycharm中不显示latest version
  7. CTF---青青子衿(无C++注册机)
  8. 程序猿头头(object与数组的简单应用)
  9. 杜凯杰教学数据分析:python 图片爬取 爬取各校校花图片
  10. 如何定制zencart模板