如何用python创建一个下载网站-用Python下载一个网页保存为本地的HTML文件实例...
我们可以用Python来将一个网页保存为本地的HTML文件,这需要用到urllib库。
比如我们要下载山东大学新闻网的一个页面,该网页如下:
实现代码如下:
import urllib.request
def getHtml(url):
html = urllib.request.urlopen(url).read()
return html
def saveHtml(file_name, file_content):
# 注意windows文件命名的禁用符,比如 /
with open(file_name.replace('/', '_') + ".html", "wb") as f:
# 写文件用bytes而不是str,所以要转码
f.write(file_content)
aurl = "http://www.view.sdu.edu.cn/info/1003/75240.htm"
html = getHtml(aurl)
saveHtml("sduview", html)
print("下载成功")
打开相应的目录可以看到这个网页已经被下载保存成功了
我们用浏览器打开这个网页文件如下
由于我们只是下载了网页的主要源码,其中的很多图片之类的文件都不在这里。因此这种方法只适用于提取文字内容。
以上这篇用Python下载一个网页保存为本地的HTML文件实例就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持软件开发网。
您可能感兴趣的文章:解决python3中的requests解析中文页面出现乱码问题浅谈python requests 的put, post 请求参数的问题详解Python requests 超时和重试的方法python3 requests中使用ip代理池随机生成ip的实例Python基于FTP模块实现ftp文件上传操作示例python实现requests发送/上传多个文件的示例python3 requests库文件上传与下载实现详解
如何用python创建一个下载网站-用Python下载一个网页保存为本地的HTML文件实例...相关推荐
- 怎么在python下载网站内容-用Python下载一个网页保存为本地的HTML文件实例
我们可以用Python来将一个网页保存为本地的HTML文件,这需要用到urllib库. 比如我们要下载山东大学新闻网的一个页面,该网页如下: 实现代码如下: import urllib.request ...
- python下载网页上的文件_用Python下载一个网页保存为本地的HTML文件实例
Python打开网页并另存为静态html怎么实现 如何用python把网页上的文本内容保存下来那一世的长情,谱一首长相思,冷了多少凄凉,漫了多少青丝,化作多少烟雨,吹散多少世间情!徒悲,奈何,这一世, ...
- 用Python下载一个网页保存为本地的 HTML文件
我们可以用Python来将一个网页保存为本地的HTML文件,这需要用到urllib库. 比如我们要下载山东大学新闻网的一个页面,该网页如下: 实现代码如下 import urllib.requestd ...
- 【python爬虫】对喜马拉雅上一个专辑的音频进行爬取并保存到本地
>>>内容基本框架: 1.爬虫目的 2.爬取过程 3.代码实现 4.爬取结果 >>>实验环境: python3.6版本,pycharm,电脑可上网. [一 爬虫目 ...
- python语言的官方网站地址-Python网络编程 - 请求地址上的文件并下载
我们用到了requests库,由于是第三方的,必须下载 如果是python 2.x用下面命令 pip install requests python 3.x用下面命令 easy_install req ...
- python 创建虚拟环境时报错OSError, setuptools下载失败
以前虚拟环境一下子就装好了, 今天多次尝试,发现错误信息总是如下 D:\vir_env\supetset>virtualenv env Using base prefix 'c:\\python ...
- 用python创建微信机器人_用Python创建微信机器人
原标题:用Python创建微信机器人 文/裸睡的猪哥 图片来源于网络 微信,一个日活10亿的超级app,不仅在国内社交独领风骚,在国外社交也同样占有一席之地.今天我们要讲的便是如何用Python来做一 ...
- python语言的主网站网址-python官方网站
广告关闭 腾讯云双11爆品提前享,精选热门产品助力上云,云服务器首年88元起,买的越多返的越多,最高满返5000元! 由于整个python语言从规范到解释器都是开源的,所以理论上,只要水平够高,任何人 ...
- python爬取音乐网站排行榜_通过Python轻松访问音乐网站歌曲,python,爬取
准备工作: 1.在已经安装python开发环境的情况下,还需安装第三方库:requests,安装教程可以参考: 2.对目标网站进行分析,获取目标文件链接 目标文件:第一页中的20个音乐文件 获取到歌曲 ...
最新文章
- 我的第一个Windows Phone 7应用程序
- 【搜遍互联网,集百家之长】环境配置从入门到放弃之Mac环境下,安装XAMPP,给phpstorm安装Xdebug调试工具...
- 合泰单片机 熔丝_合泰单片机HT66F018红外发射C程序及电路图
- Net5 已经来临,让我来送你一个成功
- LintCode 1677. 石头(自定义优先队列)
- 在每天下午五点使用计算机,邮件攻击主要是_每天下午5点使用计算机_apt的攻击目标一般不是...
- ThinkPHP删除指定文件(物理删除)
- python装饰器有几种_Python装饰器使用你可能不知道的几种姿势
- 没了Ghost,系统也能“雨过天晴”了
- C语言求素数的简化算法
- Android studio Intent
- Learning Affinity from Attention End-to-End Weakly-Supervised Semantic Segmentation withTransformers
- 浅谈润乾报表与QlikView对比
- C语言 写一个函数求两个数的较大值
- YOLOX改进之模型轻量化(Lite)
- 牛客暑假多校第二场 K carpet
- 灰度图像增强和图像去噪
- execute,executeQuery,executeUpdate三个方法有什么区别呢?
- PyQt(Python+Qt)学习随笔:Qt Designer中部件的调色板palette属性和字体font属性设置
- 【雅思写作】第一章:写作基础
热门文章
- dell台式机进入安全模式_华为发布首款商用台式机,商用PC市场再掀变革?
- mysql主从skip1677_解决字符集不同引起的主从同步异常1677报错问题
- 石嘴山考计算机在哪里报名,石嘴山中考报名系统
- ssm商务会员管理系统_会员管理商城开发
- tcp linux 报文内容,linux – tcpdump – 只是逐行输出数据包内容
- mfc上位机网络接收图片并显示_工控机上位机软件的开发历程
- 使用VAE、CNN encoder+孤立森林检测ssl加密异常流的初探——真是一个忧伤的故事!!!...
- dubbo协议原理机制 单一长连接
- FastJson常见问题
- 【物联网云端对接-1】 通过HTTP协议与微软Azure IoT hub进行云端通信