import requests
from bs4 import BeautifulSoupresponse = requests.get("https://www.autohome.com.cn/news/")# 1. content /text  的区别
# print(response.content)  # content 拿到的字节
response.encoding = 'gbk'
# print(response.text)  # text 拿到的文本信息soup  = BeautifulSoup(response.text,'html.parser')# tag = soup.find(id='auto-channel-lazyload-article')  # 找唯一的值,缩小范围
# h3 = tag.find(name='h3',class_ ='')  # class是关键词所以要加下划线, 或者使用下面的方式
# h3 = tag.find(name='h3',attrs= {'class':''})  #
# print(h3)# 链式写法
li_list = soup.find(id='auto-channel-lazyload-article').find_all(name='li')for li in li_list:title = li.find('h3') #获取标题if not title:# 如果为null,跳出continuetitle = title.textsummary = li.find("p").texturl = li.find("a").get('href')img = li.find("img").get('src')print(img)# 保存图片res = requests.get(img)file_name = "%s.jpg"%(title,)with open(file_name,'wb') as f:f.write(res.content) #保存字节内容

更多精彩文章请关注 王明昌博客

py 爬取汽车之家新闻案例相关推荐

  1. 爬虫【爬取汽车之家新闻】

    代码示例 # coding:utf-8 import requests from bs4 import BeautifulSoup# http方式 response = requests.get('h ...

  2. 爬取汽车之家图片 - scrapy - crawlspider - python爬虫案例

    爬取汽车之家图片 需求:爬取汽车之家某一个汽车的图片 ​ 一. 普通scrapy 第一步 页面分析 目标url: https://car.autohome.com.cn/photolist/serie ...

  3. python爬虫(二十四)爬取汽车之家某品牌图片

    爬取汽车之家某品牌图片 需求 爬取汽车之家某品牌的汽车图片 目标url https://car.autohome.com.cn/photolist/series/52880/6957393.html# ...

  4. python爬虫利用Scrapy框架爬取汽车之家奔驰图片--实战

    先看一下利用scrapy框架爬取汽车之家奔驰A级的效果图 1)进入cmd命令模式下,进入想要存取爬虫代码的文件,我这里是进入e盘下的python_spider文件夹内 C:\Users\15538&g ...

  5. 使用scrapy框架爬取汽车之家的图片(高清)

    使用scrapy框架爬取汽车之家的图片(高清) 不同于上一篇的地方是,这篇要爬取的是高清图片,而不仅仅是缩略图. 先来看一下要爬取的页面:https://car.autohome.com.cn/pic ...

  6. PYTHON爬取汽车之家数据

    PYTHON爬取汽车之家数据 使用知识 使用BeautifulSoup模块 使用正则表达式 使用到多线程爬取 使用说明 使用前请安装BeauifulSoup 起始页面: https://www.aut ...

  7. python3 selenium webdriver.Chrome php 爬取汽车之家所有车型详情数据[开源版]

    介绍 本接口是车型库api的补充,用于爬取汽车之家所有车型详情数据 开源地址:https://gitee.com/web/CarApi/tree/master/python 软件架构 python3 ...

  8. python爬取汽车之家_python爬虫实战之爬取汽车之家网站上的图片

    随着生活水平的提高和快节奏生活的发展.汽车开始慢慢成为人们的必需品,浏览各种汽车网站便成为购买合适.喜欢车辆的前提.例如汽车之家网站中就有最新的报价和图片以及汽车的相关内容,是提供信息最快最全的中国汽 ...

  9. python3爬虫系列16之多线程爬取汽车之家批量下载图片

    python3爬虫系列16之多线程爬取汽车之家批量下载图片 1.前言 上一篇呢,python3爬虫系列14之爬虫增速多线程,线程池,队列的用法(通俗易懂),主要介绍了线程,多线程,和两个线程池的使用. ...

最新文章

  1. Windows xp 无人值守远程安装部署
  2. 强化学习AI:它菜了,我慌了
  3. 算法提高课-图论-负环-AcWing 1165. 单词环:spfa判正环、二分、01分数规划
  4. mysql删除数据太多卡死解决办法
  5. 原型模式 —— Java的赋值、浅克隆和深度克隆的区别
  6. nfc加密卡pm3和pm5区别_小米手环4/5 NFC添加加密门禁
  7. 计算机创新发展战略,计算机行业:《智能汽车创新发展战略》征求意见稿点评...
  8. 元素与集合的问题思考
  9. 新来的同事把公司现有项目的性能优化了一遍,来看看他是怎么做到的
  10. php preg_split 正则截取字符串
  11. mysql和php长度的漏洞_mysql和php字符长度判断
  12. Unity 隐藏鼠标
  13. JAVA 如何控制模拟表单提交_java后端模拟表单提交
  14. android 农信易扫app源码,农信易扫 · 全自动 上码教程 · 看云
  15. 华南理工大学计算机学院创新班,高校纷推创新班揽生源 逐步淘汰冷门专业
  16. windows11关闭安全中心的病毒和威胁防护时,打不开,弹出打开应用需要打开windowsdefender链接问题
  17. bat一键清理系统垃圾/系统日志
  18. 华硕ZenFone 7系列旗舰5G智能手机凭借Pixelworks显示技术展现惊人的视觉效果
  19. VM虚拟机 - Docker - CentOS 7 - 快速使用Docker从零搭建Hadoop完全分布式集群详细教程(亲测有效,※吐血推荐※)(内含快速启动容器脚本)
  20. Qiyuan - 接小球游戏4.0

热门文章

  1. 【58沈剑架构系列】一分钟了解负载均衡的一切
  2. Flutter Ink,InkWell,InkResponse水波纹实现(2.3)
  3. python中write什么意思_python file write () 方法概括及作用分析(实例)
  4. 下载kaggle比赛的数据集
  5. 蓝奏云直链解析API接口
  6. VMM验证方法学学习随笔
  7. SuperMap GIS 8C(2017) 产品白皮书
  8. 微信聊天记录丢失后的记录
  9. 用JAVA awt实现Image Asset Studio生成圆形或圆角矩形图片功能
  10. 问题 C: Fraction 分数类 I