Python之网络图片爬取
import requests
import os
url = "https://imgsa.baidu.com/exp/w=480/sign=086ffb78b98f8c54e3d3c4270a282dee/d0c8a786c9177f3ec037c19b7dcf3bc79f3d5620.jpg"
root = "D://VscodePy//pics//" # 最后必须加//,否则图片会保存在VscodePy目录,pics成为名字开头的一部分
img_path = root + url.split('/')[-1]
print(img_path)def getHTMLText(url):try:r = requests.get(url, timeout=30)r.raise_for_status() # 如果不是200,引发HTTPError异常# print(r.content)if not os.path.exists(root):os.mkdir(root) # 若不存在路径则创建if not os.path.exists(img_path): # 若图片文件不存在with open(img_path, "wb") as f: # 为什么不能是root?而是img_path# 因为它指的是文件名,可换成要保存的路径+//abc.jpgf.write(r.content)f.close()print("图片爬取成功!")else:print("图片已存在!")except:print("产生异常")if __name__ == "__main__":getHTMLText(url)
Python之网络图片爬取相关推荐
- python爬去百度文库_利用Python语言轻松爬取数据[精品文档]
利用 Python 语言轻松爬取数据 对于小白来说,爬虫可能是一件非常复杂. 技术门槛很高的事情. 比如有人认为学爬虫必须精通 Python ,然后哼哧哼哧系统学习 Python 的每个知识点,很久之 ...
- python爬取贴吧所有帖子-Python实现的爬取百度贴吧图片功能完整示例
本文实例讲述了Python实现的爬取百度贴吧图片功能.分享给大家供大家参考,具体如下: #coding:utf-8 import requests import urllib2 import urll ...
- 如何利用Python网络爬虫爬取微信朋友圈动态--附代码(下)
前天给大家分享了如何利用Python网络爬虫爬取微信朋友圈数据的上篇(理论篇),今天给大家分享一下代码实现(实战篇),接着上篇往下继续深入. 一.代码实现 1.修改Scrapy项目中的items.py ...
- [python] 常用正则表达式爬取网页信息及分析HTML标签总结
这篇文章主要是介绍Python爬取网页信息时,经常使用的正则表达式及方法.它是一篇总结性文章,实用性比较大,主要解决自己遇到的爬虫问题,也希望对你有所帮助~ 当然如果会Selenium基于自动化测试爬 ...
- [python学习] 简单爬取维基百科程序语言消息盒
文章主要讲述如何通过Python爬取维基百科的消息盒(Infobox),主要是通过正则表达式和urllib实现:后面的文章可能会讲述通过BeautifulSoup实现爬取网页知识.由于这方面的文章还是 ...
- python爬取ajax动态内容肯德基门店,Python爬虫如何爬取KFC地址
随着人们生活水平的提高,肯德基这类的快餐消费的十分火爆,成为小朋友和年轻人的最爱,我们到一个地方想要找到肯德基店面,会根据导航获取肯德基地址,那你知道我们也可以使用python爬虫获取KFC地址吗?我 ...
- python爬取网页表格数据匹配,python爬虫——数据爬取和具体解析
标签:pattern div mat txt 保存 关于 json result with open 关于正则表达式的更多用法,可参考链接:https://blog.c ...
- python爬取百度文库_利用Python语言轻松爬取数据
利用 Python 语言轻松爬取数据 对于小白来说,爬虫可能是一件非常复杂. 技术门槛很高的事情. 比如有人认为学爬虫必须精通 Python ,然后哼哧哼哧系统学习 Python 的每个知识点,很久之 ...
- python爬电影_使用Python多线程爬虫爬取电影天堂资源
最近花些时间学习了一下Python,并写了一个多线程的爬虫程序来获取电影天堂上资源的迅雷下载地址,代码已经上传到GitHub上了,需要的同学可以自行下载.刚开始学习python希望可以获得宝贵的意见. ...
最新文章
- js中定义变量之②var let const的区别
- 阿里巴巴硅谷 Istio 专家解读Istio 1.0 发布
- 在一台服务器绑定多个IP
- idea tomcat乱码_Tomcat新手常见问题
- java中的堆、栈、方法区等比较
- 如何简单快速调试高大上的谷歌浏览器
- com.alibaba.dubbo.rpc.RpcException: Forbid consumer 192.168.184.1 access service com.foreveross.syst
- 1607: 字符棱形
- c语言数据结构 字符串,C++数据结构之字符串操作
- 流畅的python 数据模型
- 上传本地项目到githup(githup改版后将master改为main)
- java.util.ConcurrentModificationException的解决办法
- 模仿作业帮、猿题库搜题功能(包含图片文字识别)
- Discriminative deep metric learning for face verification in the wild 度量学习(CVPR2014)
- 程序员工资真的高吗?
- 电子科技大学关于佛系青年的社会实践调查
- 清华大学计算机系成立量子软件研究中心,应明生受聘为主任
- Cesium中对geojson的处理
- 常用的数据标准化方法
- 《算法导论》第九章.中位数和顺序统计量
热门文章
- MySQL中间件之ProxySQL(13):ProxySQL集群
- C# 线程知识--使用Task执行异步操作(转)
- 我的第一篇blog 【随意】
- Inside ASP.NET 2.0 – Controls Model(转载)
- 官方文档翻译-ESP32-High Resolution Timer
- STM8S103F2 EEPROM读写
- ubuntu 12.04下apache 配置家目录地址
- matplotlib.pyplot常用画图方式函数封装(一)——.plot绘制折线图及设置坐标轴箭头完美解决
- 《研磨设计模式》chap20 享元模式 Flyweight (1)前奏介绍
- 《研磨设计模式》chap17 策略模式(2) 总结