我们可以用Python来将一个网页保存为本地的HTML文件,这需要用到urllib库。

比如我们要下载山东大学新闻网的一个页面,该网页如下:

实现代码如下:

import urllib.request

def getHtml(url):

html = urllib.request.urlopen(url).read()

return html

def saveHtml(file_name, file_content):

# 注意windows文件命名的禁用符,比如 /

with open(file_name.replace('/', '_') + ".html", "wb") as f:

# 写文件用bytes而不是str,所以要转码

f.write(file_content)

aurl = "http://www.view.sdu.edu.cn/info/1003/75240.htm"

html = getHtml(aurl)

saveHtml("sduview", html)

print("下载成功")

打开相应的目录可以看到这个网页已经被下载保存成功了

我们用浏览器打开这个网页文件如下

由于我们只是下载了网页的主要源码,其中的很多图片之类的文件都不在这里。因此这种方法只适用于提取文字内容。

以上这篇用Python下载一个网页保存为本地的HTML文件实例就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持软件开发网。

您可能感兴趣的文章:解决python3中的requests解析中文页面出现乱码问题浅谈python requests 的put, post 请求参数的问题详解Python requests 超时和重试的方法python3 requests中使用ip代理池随机生成ip的实例Python基于FTP模块实现ftp文件上传操作示例python实现requests发送/上传多个文件的示例python3 requests库文件上传与下载实现详解

如何用python创建一个下载网站-用Python下载一个网页保存为本地的HTML文件实例...相关推荐

  1. 怎么在python下载网站内容-用Python下载一个网页保存为本地的HTML文件实例

    我们可以用Python来将一个网页保存为本地的HTML文件,这需要用到urllib库. 比如我们要下载山东大学新闻网的一个页面,该网页如下: 实现代码如下: import urllib.request ...

  2. python下载网页上的文件_用Python下载一个网页保存为本地的HTML文件实例

    Python打开网页并另存为静态html怎么实现 如何用python把网页上的文本内容保存下来那一世的长情,谱一首长相思,冷了多少凄凉,漫了多少青丝,化作多少烟雨,吹散多少世间情!徒悲,奈何,这一世, ...

  3. 用Python下载一个网页保存为本地的 HTML文件

    我们可以用Python来将一个网页保存为本地的HTML文件,这需要用到urllib库. 比如我们要下载山东大学新闻网的一个页面,该网页如下: 实现代码如下 import urllib.requestd ...

  4. 【python爬虫】对喜马拉雅上一个专辑的音频进行爬取并保存到本地

    >>>内容基本框架: 1.爬虫目的 2.爬取过程 3.代码实现 4.爬取结果  >>>实验环境: python3.6版本,pycharm,电脑可上网. [一 爬虫目 ...

  5. python语言的官方网站地址-Python网络编程 - 请求地址上的文件并下载

    我们用到了requests库,由于是第三方的,必须下载 如果是python 2.x用下面命令 pip install requests python 3.x用下面命令 easy_install req ...

  6. python 创建虚拟环境时报错OSError, setuptools下载失败

    以前虚拟环境一下子就装好了, 今天多次尝试,发现错误信息总是如下 D:\vir_env\supetset>virtualenv env Using base prefix 'c:\\python ...

  7. 用python创建微信机器人_用Python创建微信机器人

    原标题:用Python创建微信机器人 文/裸睡的猪哥 图片来源于网络 微信,一个日活10亿的超级app,不仅在国内社交独领风骚,在国外社交也同样占有一席之地.今天我们要讲的便是如何用Python来做一 ...

  8. python语言的主网站网址-python官方网站

    广告关闭 腾讯云双11爆品提前享,精选热门产品助力上云,云服务器首年88元起,买的越多返的越多,最高满返5000元! 由于整个python语言从规范到解释器都是开源的,所以理论上,只要水平够高,任何人 ...

  9. python爬取音乐网站排行榜_通过Python轻松访问音乐网站歌曲,python,爬取

    准备工作: 1.在已经安装python开发环境的情况下,还需安装第三方库:requests,安装教程可以参考: 2.对目标网站进行分析,获取目标文件链接 目标文件:第一页中的20个音乐文件 获取到歌曲 ...

最新文章

  1. 我的第一个Windows Phone 7应用程序
  2. 【搜遍互联网,集百家之长】环境配置从入门到放弃之Mac环境下,安装XAMPP,给phpstorm安装Xdebug调试工具...
  3. 合泰单片机 熔丝_合泰单片机HT66F018红外发射C程序及电路图
  4. Net5 已经来临,让我来送你一个成功
  5. LintCode 1677. 石头(自定义优先队列)
  6. 在每天下午五点使用计算机,邮件攻击主要是_每天下午5点使用计算机_apt的攻击目标一般不是...
  7. ThinkPHP删除指定文件(物理删除)
  8. python装饰器有几种_Python装饰器使用你可能不知道的几种姿势
  9. 没了Ghost,系统也能“雨过天晴”了
  10. C语言求素数的简化算法
  11. Android studio Intent
  12. Learning Affinity from Attention End-to-End Weakly-Supervised Semantic Segmentation withTransformers
  13. 浅谈润乾报表与QlikView对比
  14. C语言 写一个函数求两个数的较大值
  15. YOLOX改进之模型轻量化(Lite)
  16. 牛客暑假多校第二场 K carpet
  17. 灰度图像增强和图像去噪
  18. execute,executeQuery,executeUpdate三个方法有什么区别呢?
  19. PyQt(Python+Qt)学习随笔:Qt Designer中部件的调色板palette属性和字体font属性设置
  20. 【雅思写作】第一章:写作基础

热门文章

  1. dell台式机进入安全模式_华为发布首款商用台式机,商用PC市场再掀变革?
  2. mysql主从skip1677_解决字符集不同引起的主从同步异常1677报错问题
  3. 石嘴山考计算机在哪里报名,石嘴山中考报名系统
  4. ssm商务会员管理系统_会员管理商城开发
  5. tcp linux 报文内容,linux – tcpdump – 只是逐行输出数据包内容
  6. mfc上位机网络接收图片并显示_工控机上位机软件的开发历程
  7. 使用VAE、CNN encoder+孤立森林检测ssl加密异常流的初探——真是一个忧伤的故事!!!...
  8. dubbo协议原理机制 单一长连接
  9. FastJson常见问题
  10. 【物联网云端对接-1】 通过HTTP协议与微软Azure IoT hub进行云端通信