使用爬虫获取毛豆全部在售车型,目前只获取了图片的地址。

"""
功能:获取毛豆新车网的在售车型信息
作者:Mac
时间:2020.6.11
"""
import requests
import csv
from bs4 import BeautifulSoup# 头部信息(这个站不必登陆也可以看所有车型)
headers = {"User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64; rv:68.0) Gecko/20100101 Firefox/68.0"
}# 目标链接:点击第二页,发现pg是2,第三页,pg是3......最后是17  keyword=  这个可有可无
target = "https://www.maodou.com/car/list/all/pg{}"# 解析数据
def analy(html):soup = BeautifulSoup(html, "lxml")divs = soup.find_all("div", class_="car-photo")for div in divs:# print(div.img["alt"])   #大众朗逸 2019款 1.5L 自动舒适版 国VI# print(div.img["data-original"]) # 车的图片# 保存数据save(div.img)# 保存数据
def save(datas):with open("MaoDouNewCars.csv", "a", newline="", encoding="utf-8-sig") as cf:writer = csv.writer(cf)# 写入一页的全部数据writer.writerow([datas["alt"], datas["data-original"]])for i in range(18):  # 18 = 17 + 1# 1.发起请求response = requests.get(url=target.format(i), headers=headers)# 2.解析数据(此步骤包含了# 3.保存数据)analy(response.content.decode())

效果如图

python获取毛豆新车网在售车型相关推荐

  1. [Python]获取起点小说网的更新情况

    原创文章,欢迎转载.转载请注明:转载自 祥的博客 原文链接:https://blog.csdn.net/humanking7/article/details/90176191 文章目录 @[toc] ...

  2. python 获取公网 外网 ip 几种方式

    实例如下: from urllib.request import urlopen from json import loadmy_ip = urlopen('http://ip.42.pl/raw') ...

  3. python爬虫获取中国天气网天气数据 requests BeautifulSoup re

    python获取中国天气网天气数据:http://www.weather.com.cn/textFC/henan.shtml main.py # -*- coding: utf-8 -*- impor ...

  4. 易车、毛豆新车、蛋蛋订车买车到底靠谱吗?

    对于网络购物,相信大部分的年轻人,甚至是上了一些年纪的朋友都不会陌生,对于汽车来说,似乎网上购车平台也是一种可行的方式,那么网上购车平台到底靠谱吗? 当然,互联网消费一定是未来的趋势,网上购车平台经过 ...

  5. 新车电商百花争鸣时代:毛豆新车VS花生好车谁长谁短?

    近年来,新车电商的发展日益兴起,逐渐形成风口,其中,融资租赁形式让大家对汽车销售有了全新的认识.此类形式购买新车与4S店购车最大的区别就是:仅0到1成首付便可快速把新车开走,提车效率提高,购车选择方案 ...

  6. python 获取天气接口数据

    从微信公众号中看到的代码,以此记录 用Python获取中国天气网天气接口数据 import urllib.request import json code='101160101' url='http: ...

  7. 可转债代码交流第二期:利用Python获取集思录数据(改)

    上期内容讲解了宁稳网数据获取的方法(用于初步计算未上市可转债价格),具体方法参考第一期:可转债代码交流第一期:利用Python获取宁稳网数据(包含基本的环境搭建与Python编辑器安装方法) 本人并非 ...

  8. python读取网站_科学网—python 获取网址 - 林清莹的博文

    Python获取网址的内容# coding=utf-8 import urllib url = "http://www.baidu.com" data = urllib.urlop ...

  9. python获取公网ip的几种方式_python获取外网ip地址的方法总结

    本文实例总结了python获取外网ip地址的方法.分享给大家供大家参考.具体如下: 一.利用脚本引擎库直接获取 import console; import web.script import ine ...

最新文章

  1. 服务器部署java网站,服务器部署java网站
  2. BZOJ4912 SDOI2017天才黑客(最短路+虚树)
  3. 如何得到暴雪娱乐公司的工作机会?
  4. 改进型的时钟置换算法-解惑
  5. FCGF论文阅读笔记
  6. deepin 安装cuda 编译 ffmpeg
  7. YUV通过MediaCodec编码H264
  8. python xml解析库_Python xml解析库xml_models2
  9. 采用C#泛型实现数据库之间的切换
  10. 智能制造与大数据——数据采集实现数字化
  11. java转行能做什么_java转行可以做什么?应该如何去考虑?
  12. 实时工业以太网EtherCAT高速发展背后
  13. 计算机辅助翻译实践语料库,《计算机辅助翻译实践》
  14. python三国演义人物出场_Python教你查询《三国演义》书籍人物出场次序
  15. Unity高质量场景打光参考资料
  16. JAVA学习第一步-配置JAVA开发环境和学习资料
  17. java 定义别名_为java类起别名
  18. 51单片机+LCD12864的万年历Proteus仿真
  19. 男,40岁,总监,失业:职场中年人,愿你终能体面的离开
  20. 【CSDN云VS腾讯云】要不然怎么说CSDN开发云是打工人和学生党的福音呢?

热门文章

  1. ios开发学习中遇到问题[LayoutConstraints] Unable to simultaneously satisfy constraints.的解决方法
  2. [error] Vivado代码仿真时错误提示:ERROR: [Common 17-39] ‘launch_simulation‘ failed due to earlier errors.
  3. opencv再学习之路(八)---设定感兴趣区域(RIO)
  4. css动画让箭头上下跳动
  5. Latex 数学符号--双括号
  6. Leetcode:NO.15 三数之和 夹逼
  7. 【面试题】闭包是什么?this 到底指向谁?
  8. 利用Python实现新冠疫情数据可视化(获取疫情历史数据,制作南丁格尔玫瑰图、疫情地图、动态疫情组合图、词云)
  9. Dagger2与AndroidInjector
  10. eclipse发展与简介