python爬取汽车之家图片,Python requests 爬取汽车之家全部品牌logo,urllib下载到本地...
首先是汽车之家品牌页面的HTML
我们定位到图片那个位置,这个img标签的src加上https就是图片完整的地址
那么品牌名称就是下面那个p标签的text
接下来我们的目的就是从中取出src和text了,下面是获取的全部代码
# coding:utf-8
# 引入相关模块
import requests
from bs4 import BeautifulSoup
url = "https://car.autohome.com.cn/zhaoche/pinpai/"
# 请求汽车之家的 URL,获取其 text 文本
wbdata = requests.get(url)
#编码格式,避免中文乱码的情况出现
wbdata.encoding = 'gb18030'
# print(wbdata)
# 对获取到的文本进行解析
soup = BeautifulSoup(wbdata.text,'lxml')
# print(soup)
# 从解析文件中通过 select 选择器定位指定的元素,返回一个列表
# icons = soup.select("a.pic > img")
# print(icons)
titles = soup.select("div.uibox-con >dl > dt > p > a")
#这里很关键,拿出来的数据其实包含了两个同级p标签,
#第一个是logo第二个是品牌文字,所以我这里的处理就是根据奇偶数判断是logo还是品牌文字
src = ''
totalDatas = []
for i in range(len(titles)):
if i % 2 ==0 :
src = titles[i].img.get("src")
# print(src)
else:
title = titles[i].get_text();
# print(title)
#做一个写入
datas = {
"src": "https:" +src,
"title":title
}
totalDatas.append(datas)
printf(totalDatas)
当然这里得到了全部的图片信息,那么我们应该把它下载到本地方便自己使用
import os,stat
import urllib.request
#必须使用ssl,否则会报证书验证的错误
import ssl
ssl._create_default_https_context = ssl._create_unverified_context
def save_img(img_url,file_name,file_path='test\img'):
#保存图片到磁盘文件夹 file_path中,默认为当前脚本运行目录下的 test\img文件夹
try:
if not os.path.exists(file_path):
print ('文件夹',file_path,'不存在,重新建立')
#os.mkdir(file_path)
os.makedirs(file_path)
#获得图片后缀
file_suffix = os.path.splitext(img_url)[1]
#拼接图片名(包含路径)
filename = '{}{}{}{}'.format(file_path,os.sep,file_name,file_suffix)
#下载图片,并保存到文件夹中
urllib.request.urlretrieve(img_url,filename=filename)
except IOError as e:
print ('文件操作失败',e)
except Exception as e:
print ('错误 :',e)
for data in totalDatas:
img_url = data["src"]
file_name = data["title"]
save_img(img_url,file_name)
python爬取汽车之家图片,Python requests 爬取汽车之家全部品牌logo,urllib下载到本地...相关推荐
- python爬虫爬取百度贴吧图片,requests方法
每天一点点,记录学习 近期爬虫项目,看完请点赞哦---: 1:python 爬取菜鸟教程python100题,百度贴吧图片反爬虫下载,批量下载 2:python爬虫爬取百度贴吧图片,requests方 ...
- python 脚本将视频转化成图片 | python scripts to convert video to pictures
python 脚本将视频转化成图片 | python scripts to convert video to pictures python video_to_images.py 运行时,修改输入.输 ...
- Python requests 爬取汽车之家全部品牌logo,urllib下载到本地
首先是汽车之家品牌页面的HTML 我们定位到图片那个位置,这个img标签的src加上https就是图片完整的地址 那么品牌名称就是下面那个p标签的text 接下来我们的目的就是从中取出src和text ...
- 【Python网络爬虫实战篇】使用selenium+requests爬取下载高清源视频:关于爬取m3u8文件链接解析为ts视频合并成mp4视频的分析实战
这两天博主在摸鱼时,偶然间接触到了流媒体的概念,一时间来了兴致.再加上之前博主有着七.八年的视频制作经验,深知视频素材获取的不易.因此,打算利用自己所学的python网络爬虫的知识,通过编写代码实现获 ...
- python,分析网页,使用 bs4和requests 爬取网页指定图片
阅读之前先保证会使用python并且了解html前端结构 首先打开 目标网站 我们可以看到一个动漫角色的图片,现在我们要利用python程序来保存这张图片到本地. 1.右键图片 选择审查元素(有些浏览 ...
- python爬虫入门练习,使用正则表达式和requests爬取LOL官网皮肤
刚刚python入门,学会了requests模块爬取简单网页,然后写了个爬取LOL官网皮肤的爬虫,代码奉上 #获取json文件 #获取英雄ID列表 #拼接URL #下载皮肤 #导入re request ...
- python爬虫爬取起点小说_python3爬虫-使用requests爬取起点小说
import requests from lxml import etree from urllib import parse import os, time def get_page_html(ur ...
- 如何在python中显示电脑中的图片-python如何在终端里面显示一张图片
Linux终端里面可谓是奇妙无限,很多优秀的软件都诞生在终端里面.相较之下,Windows本身的理念和Linux就不一致,所以,你懂得. 下面,我们不妨先思考一下,如何在终端里面显示一张图片? 在终端 ...
- 【爬虫】使用beautifulsoup、requests爬取网页上的图片;循环爬取上市公司高管信息
**声明:本篇博文只用于对于爬虫技术的学习交流.如果侵犯到相关网站利益,请联系我删除博文.造成不便还请见谅.希望各位同学在学习的时候不要过于频繁的去请求. 最近博主在学习前端开发和网页相关的东西,这些 ...
最新文章
- 2021牛客暑期多校训练营(二) J. Product of GCDs 不动脑子的莫比乌斯反演做法(
- Java学习_day005:循环结构
- 基于阿里的Node全栈之路(二)阿里负载均衡的HTTPS优化方案
- ADO学习(八)源码示例
- java本地创建zk节点
- mysql数据库的链接地址_常用数据库连接URL地址大全
- Kotlin入门(22)适配器的简单优化
- 计算重叠最长子串问题
- 【树上分块】【dfs序】2018沈阳网络赛 —— J题
- 古体字与简体字对照表_中文簡体字与繁体字对照表
- t检验自由度的意义_统计学常用概念:T检验、F检验、卡方检验、P值、自由度...
- 计算机教师中级职称个人总结,职称个人总结
- linux 使用shell/python编写钉钉自动监控报警脚本
- Android NVidia Tegra2平台Camera架构浅析
- android 让app全屏显示,Android app设置全屏模式
- (转载)深入了解iOS中的OOM(低内存崩溃)
- mc通用计算机,《我的世界》里打造一台计算机有多难?复旦大神花一年终于实现!...
- 计算机 游戏第24级,全国计算机一级考试题库-全国计算机等级考试题(24页)-原创力文档...
- 徐小湛概率论与数理统计课件_概率论与数理统计-徐小湛-视频教程70讲
- 1-氨丙基-3-甲基咪唑溴盐离子液体修饰碳量子点(L-CQDs)负载TiO2纳米颗粒(试剂)