python做一个爬虫要用到什么软件_python实现简单爬虫功能
在我们日常上网浏览网页的时候,经常会看到一些好看的图片,我们就希望把这些
图片保存下载,或者用户用来做桌面壁纸,或者用来做设计的素材。
我们最常规的做法就是通过鼠标右键,选择另存为。但有些图片鼠标右键的时
候并没有另存为选项,还有办法就通过就是通过截图工具截取下来,但这样就降低
图片的清晰度。好吧~!其实你很厉害的,右键查看页面源代码。
我们可以通过
python
来实现这样一个简单的爬虫功能,把我们想要的代码爬
取到本地。下面就看看如何使用
python
来实现这样一个功能。
一,获取整个页面数据
首先我们可以先获取要下载图片的整个页面信息。
getjpg.py
#coding=utf-8
import
urllib
def
getHtml(url):
page = urllib.urlopen(url)
html = page.read()
return
html
html = getHtml(
"http://tieba.baidu.com/p/2738151262"
)
html
Urllib
模块提供了读取
web
页面数据的接口,我们可以像读取本地文件一样读
取
www
和
ftp
上的数据。首先,我们定义了一个
getHtml()
函数
:
urllib.urlopen()
方法用于打开一个
URL
地址。
read()
方法用于读取
URL
上的数据,向
getHtml()
函数传递一个网址,并把整
个页面下载下来。执行程序就会把整个网页打印输出。
二,筛选页面中想要的数据
Python
提供了非常强大的正则表达式,我们需要先要了解一点
python
正则表
达式的知识才行。
http://www.cnblogs.com/fnng/archive/2013/05/20/3089816.html
假如我们百度贴吧找到了几张漂亮的壁纸,通过到前段查看工具。找到了图片的地
址,如:
src=”http://imgsrc.baidu.com/forum......jpg”
pic_ext=”jpeg”
修改代码如下:
import
re
import
urllib
def
getHtml(url):
python做一个爬虫要用到什么软件_python实现简单爬虫功能相关推荐
- python做一个【批量加密解密】软件,让你的文件有程序加密保护,在也不怕别人乱翻你的东西了
今天这个批量加解密很简单,和上一个[软件加密]python制作一个超强的加密软件_₰₯₮ 的博客-CSDN博客 文章结合了一下,然后优化了一下 循环文件夹的所有文件,然后捉个进行加解密 def ite ...
- 用python写搜索引擎_用python做一个搜索引擎(Pylucene)的实例代码
1.什么是搜索引擎? 搜索引擎是"对网络信息资源进行搜集整理并提供信息查询服务的系统,包括信息搜集.信息整理和用户查询三部分".如图1是搜索引擎的一般结构,信息搜集模块从网络采集信 ...
- 在哪里能收到python实例代码-用python做一个搜索引擎(Pylucene)的实例代码
1.什么是搜索引擎? 搜索引擎是"对网络信息资源进行搜集整理并提供信息查询服务的系统,包括信息搜集.信息整理和用户查询三部分".如图1是搜索引擎的一般结构,信息搜集模块从网络采集信 ...
- 用python做一个搜索引擎(Pylucene)
什么是搜索引擎? 搜索引擎是"对网络信息资源进行搜集整理并提供信息查询服务的系统,包括信息搜集.信息整理和用户查询三部分".如图1是搜索引擎的一般结构,信息搜集模块从网络采集信息到 ...
- Python做一个Kindle电子书下载助手,真香!
哈喽,大家好,我是菜鸟哥! 大家有没有想过把亚马逊网站上的Kindle电子书下载到自己的电脑上? 今天分享的项目可以帮大家实现这一目的.该项目用Python开发,简单.好用.开源. 下面分享下项目的使 ...
- 利用Python做一个漂亮小姐姐词云跳舞视频
最近不少小伙伴在学 Python,想找个好玩的练手项目. 那今天分享一个,简单,适合新手的 Python 小项目. 以下是具体项目: 本文将以哔哩哔哩–乘风破浪视频为例,you-get下载视频. 同时 ...
- 十行代码,我用Python做一个迷你版的美图秀秀!
美图秀秀相信大家都不陌生,大家只要操作美图秀秀,就可以P掉图片中脸上的一些瑕疵,让人变得更加的美丽.今天小编就带领大家来借助Python和Flask来实现一个美图秀秀的网页设计,大家只需要通过网页上传 ...
- 卧槽!我用Python做一个打字测试器!看看谁是最快的男人!
对于平时经常使用电脑的小伙伴而言,一个必不可少的操作就是利用键盘进行打字的操作,想必大家对自己的打字速度也是非常的自信,但是具体的速度大家却不能够准确表述. 今天,小编就同大家利用python制作一款 ...
- 用python做一个翻译软件。
文章目录 前言 一.需要的库 二.分析处理 1.步骤 2.思路 三.代码的实现 1.翻译部分 2.图形界面代码 3.整合 总结 前言 对于我这种英语比较差的人来说,无论是敲代码还是看文档, 那都是离不 ...
- 简易版“美颜”来了!肝了一夜!用Python做一个高瘦脸神器!
"菜鸟学Python",第"519"篇原创 如今的网络时代,许多直播的博主们,在进行 直播时,都喜欢利用美颜的方式来提升自己的颜值.其中必不可少的就是瘦脸. 瘦 ...
最新文章
- 数字证书采用公钥体制进行加密和解密。每个用户有一个私钥,用它进行 (46)。。。
- ubuntu18.04安装mongodb
- laravel安装笔记 (转)
- Zero-Copysendfile浅析
- python访问注册表_读取注册表的Python代码
- java jxl 写 excel文件_Java使用jxl写入Excel文件
- 求后序遍历(信息学奥赛一本通-T1339)
- easyuefi只能在基于uefi启动的_云计算学习体系-1.1-计算机硬件基础扩展知识BIOS/UEFI/MBR/GPT...
- chrome本地文件加载跨域请求
- 三星Galaxy A73显示Geekcbench:或搭载骁龙778G
- promise用法_JavaScript中的async/await的用法和理解
- php随机数字不重复使等式成立_Schur补与矩阵打洞,SMW求逆公式,分块矩阵与行列式(不)等式...
- Python debug —— invalid literal for int() with base 10
- visual什么颜色好用_口红哪个牌子好用?浓郁显白的口红超合适你der
- html5制作多彩照片墙,照片墙不是乱贴的,教你1分钟打造高逼格照片墙!
- 微信小程序图书管理系统
- Chrome(谷歌浏览器) 程序开发32个常用插件
- R语言Bonferroni校正的成对t检验进行事后检验(post hoc)实战:单因素方差分析告诉我们并不是所有的群体手段的效果是均等的,确切地找出哪些组彼此不同使用Bonferroni校正检验
- springboot启动报org.springframework.beans.factory.UnsatisfiedDependencyException: Error creating bean..
- 秉火429笔记之七位带操作
热门文章
- 3.通信原理——随机过程(第七版 樊昌信 曹丽娜编著)
- MFC界面库BCGControlBar Pro for MFC v33.1 - 更适配Windows 11
- LKY-智慧景区可视对讲广播融合平台系统解决方案
- ES6文档 思维导图笔记
- 2021Java面试总结!平安银行java开发面试
- setuna截图怎么放大缩小_手机中的望远镜 华为P30pro是怎么做到50倍变焦?
- 空间变换与计算_02_3x3矩阵
- Python字典集合数据结构深入理解
- dem数据(dem数据格式)
- 啊哈 c语言pdf百度云,啊哈c语言完整版