python爬虫爬取车标网所有车标Logo
1.依赖
requests、BeautifulSoup、lxml
2.代码
爬取网址:http://www.chebiao.com.cn/chebiao/
import requests
from bs4 import BeautifulSouplist = ['A', 'B', 'C', 'D', 'F', 'G', 'H', 'J', 'K', 'L', 'M', 'N', 'O', 'P', 'Q', 'R', 'S', 'T', 'W', 'X', 'Y', 'Z']
#用于存车标网分类地址
newList = []
www = "http://www.chebiao.com.cn"
#根据网站分析可知,每种开头的车标url分别为http://www.chebiao.com.cn/字母/
for i in list:temp = www + "/chebiao/" + i.lower() + "/"newList.append(temp)#用于存获取到的图片url地址
imgUrls = []
#用于存车标名字,顺序和图片顺序一致
nameList = []#爬取图片地址
for x in newList:response = requests.get(x, timeout=3000)response.encoding = 'gbk'soup = BeautifulSoup(response.text, 'lxml')lis = soup.select(".chebiao ul li")for li in lis:imgUrls.append(www + str(li.select_one("img")['src']))nameList.append(li.select_one("span").text)index = 0
#根据图片url list中的地址下载图片到本地
for url in imgUrls:request1 = requests.get(url)path = 'C:\\Users\\Lance\\Desktop\\1\\' + str(nameList[index][0:-2]+".jpg")with open(path, 'wb') as f:f.write(request1.content)f.flush()f.close()index = index + 1
3.效果图
python爬虫爬取车标网所有车标Logo相关推荐
- 在当当买了python怎么下载源代码-python爬虫爬取当当网
[实例简介]python爬虫爬取当当网 [实例截图] [核心代码] ''' Function: 当当网图书爬虫 Author: Charles 微信公众号: Charles的皮卡丘 ''' impor ...
- python爬虫爬取当当网的商品信息
python爬虫爬取当当网的商品信息 一.环境搭建 二.简介 三.当当网网页分析 1.分析网页的url规律 2.解析网页html页面 书籍商品html页面解析 其他商品html页面解析 四.代码实现 ...
- python爬虫爬取知网
python爬虫爬取知网 话不多说,直接上代码! import requests import re import time import xlrd from xlrd import open_wor ...
- [python爬虫]爬取天气网全国所有县市的天气数据
[python爬虫]爬取天气网全国所有县市的天气数据 访问URL 解析数据 保存数据 所要用到的库 import requests from lxml import etree import xlwt ...
- Python爬虫爬取东方财富网的股票信息
简单的Python爬虫应用 目标:爬取东方财富网的股票信息 1.先找到要爬取的网页 2.第二步开始爬取信息 2.1 通过requests获取网页信息 2.2再通过BeautifulSoup解析: 2. ...
- python爬虫爬取慕课网中的图片
我们简单地爬取慕课网中免费课程下的第一页的图片,如想爬取多页图片,可以添加for循环自行实现 python版本:3.6.5 爬取网址:http://www.imooc.com/course/list ...
- python爬虫爬取东方财富网股票走势+一些信息
一.目标 我们的目标是爬取东方财富网(https://www.eastmoney.com/)的股票信息 我的目标是爬取100张股票信息图片 经过实际测试我的爬取范围为000001-000110,000 ...
- [Python爬虫]爬取东方财富网公司公告需要注意的几个问题
在上一篇文章中,以爬取东方财富网公司公告为例,介绍了如何爬取利用ajax加载的网页,以及如何模拟翻页.但是,在实际应用的过程中,发现了一些问题.接下来就来一一分析解决. 问题一.公告数量过多,后面的公 ...
- python爬虫-爬取当当网书籍信息存到Excel中
文章目录 一.任务 二.分析 (一).单页面的信息分析 源代码分析 目标信息定位与分析 代码设计 (二).所有目标页面链接分析 目标链接分析 代码设计 三.注意要点 四.完整代码 五.参考 一.任务 ...
- python 爬虫 爬取当当网图书信息
初次系统的学习python,在学习完基本语法后,对爬虫进行学习,现在对当当网进行爬取,爬取了基本图书信息,包括图书名.作者等 import requests from time import slee ...
最新文章
- LabVIEW纹理分析(基础篇—9)
- 25亿布局大湾区,创新工场的AI下一站
- esp32-cam的原理图
- egg mysql 连表查询_Egg中使用Sequelize框架关联查询Mysql数据库
- 【Python初学者】准备
- grpc 流式传输_编写下载服务器。 第一部分:始终流式传输,永远不要完全保留在内存中...
- android 拦截外拨电话,Android拦截外拨电话程序示例
- 深夜,在这个已不再喧嚣的城市中寻找到一片属于自己的宁静,仰望那片属于自己的星空……...
- 王者荣耀服务器维护5.3,王者荣耀3月2日体验服停机更新公告(5)
- 无人驾驶(再谈基于camera的高精度地图)
- 互联网小团队创业启示录
- java创建环境变量是用户还是系统_5.Java环境变量配置
- win10系统镜像下载及在VMware虚拟机上创建虚拟机
- linux下的ftp命令详解,Linux FTP命令详解
- 伺服电机和步进电机的区别
- WebRTC-nack机制详解
- android程序毕业答辩ppt,软件毕业答辩PPT范例
- 仪器仪表课程上的大作业——示波器的使用
- 用python实现相声、评书自动下载(六)
- Kotlin/DSL(Anko),原汁原味Kotlin开发Android---Activity Fragment与AnkoUI分离,强大的复用,更加便捷的开发
热门文章
- 关键词提取有哪些方案?刘志远回答
- 目标检测算法综述—— One-Stage方法
- nth-of-type和nth-child区别
- 机器学习用哪门语言更好
- Ajax学习(3)XMLHttpRequest的使用+数据交换格式(JSON)
- Windows 10更新 virtualbox(应用)不兼容问题(isn‘t compatible with Windows 10)
- 波尔原子模型:一段令人愉悦的历史
- 总结程序员的性格特点、生活习惯
- SQL Server 2005 还原数据库错误:System.Data.SqlClient.SqlError: 在对 'd:\Program Files\Microsoft SQL Serv
- 20130827 MHC的MVC之路