如何爬取商品详情页中的信息
如下图,我们要爬取标题和价钱和区域等
1、导入库
from bs4 import BeautifulSoup
import requests
import time
2、抓取整个HTML网页(增加判断语句,防止解析404页面)
wb_data = requests.get('https://bj.58.com/jiadian/29063883256526x.shtml')
if wb_data.status_code == 404:
pass
else:
soup = BeautifulSoup(wb_data.text, 'lxml')
3、解析抓取的内容,并定位自己想要的内容
data = {
'title':soup.title.text.strip(),
#basicinfo > div.infocard__container.haveswitch > div > div.infocard__container__item__main > span
#'price':soup.select(' span.infocard__container__item__main__text--price '),
'price': soup.select(' span.infocard__container__item__main__text--price ')[0].text.strip(),
#'pub_date':soup.select('.pr-5')[0].text.strip().split(' ')[0],
'area':soup.select('div.infocard__container__item__main > a')[0].text.strip(),
#'cates':list(soup.select('ul.det-infor > li:nth-of-type(1) > span')[0].stripped_strings),
'url':url
}
print(data)
如何爬取商品详情页中的信息相关推荐
- 商品详情页中,当鼠标放到小图上时,改变大图的图片为当前小图的图片
在做商品详情页时,我们会遇到这样的问题,当鼠标移动到小图上的时候,所对应的大图也会随之改变,变成当前鼠标所在位置的小图图片,今天我给大家分享一下我的做法,希望对大家有所帮助,也希望得到大家的指点. / ...
- 【爬虫】爬取我的CSDN中的信息
爬取博客标题 from urllib import request from lxml import etree page=1 total=0 while page<=2:request_url ...
- 仿淘宝商品详情页中(继续拖动到图文详情)
参考文章http://www.jb51.net/article/91858.htm 核心view 有2个 一个是自定义的ViewGroup 一个是自定义的ScrollView 首先是自定义的Scrol ...
- iOS 开发商品详情页中的banner中点击查看图片
本文出自code4app,原文地址:http://www.code4app.com/blog-... 轮翻播放与查看是分开的,轮翻是是用 开源的SDCycleScrollView 这里是给出的是查看的 ...
- 仿京东淘宝商品详情页中视频和图片的轮播功能
还没有学会如何上传视频到博客上,先上传图片吧 案例下载地址: https://download.csdn.net/download/dawnzeng/10430298 视频播放借用了饺子播放器,最主要 ...
- Java网络商城项目 SpringBoot+SpringCloud+Vue 网络商城(SSM前后端分离项目)十六(商品排序,Thymeleaf快速入门,商品详情页的展示)
Java网络商城项目 SpringBoot+SpringCloud+Vue 网络商城(SSM前后端分离项目)十六(商品详情页的展示) 一.商品排序 1.完善页面信息 这是用来做排序的,默认按照综合排序 ...
- 亿级流量电商详情页系统实战-28.商品详情页结构分析、缓存全量更新问题以及缓存维度化解决方案
1.前言 实时性比较高的那块数据,比如说库存,销量之类的这种数据,我们采取的实时的缓存+数据库双写的技术方案,双写一致性保障的方案 实时性要求不高的数据,比如说商品的基本信息,等等,我们采取的是三级缓 ...
- 商品详情页动态渲染系统:大型网站的多机房4级缓存架构设计
124_大型电商网站的商品详情页的深入分析 之前,咱们也是说在讲解这个商品详情页系统的架构 缓存架构,高可用服务 商品详情页系统,我们只是抽取了其中一部分来讲解,而且还做了很大程度的简化 主要是为了用 ...
- php首页遍历出商品详情页,ECSHOP首页/分类页/详情页各页面调用显示销量
1.在首页新品.热卖.精品等调用商品销售 打开 includes/lib_goods.php 在文件尾部?>前添加以下代码:function get_buy_sum($goods_id){ $s ...
最新文章
- Java社区领袖介绍平台支持选项
- 【2016-09-27-DP小练】
- 电动力学每日一题 2021/10/10
- [Swust OJ 247]--皇帝的新衣(组合数+Lucas定理)
- Fibonacci数列的幂和
- C# 事件(第四章)
- P2408 不同子串个数
- Java构造方法的继承调用
- Atitit.论图片类型 垃圾文件的识别与清理 流程与设计原则 与api概要设计 v2 pbj
- 适合iOS的15大网站推荐
- Mybatis复杂参数传参取参方式总结
- 数字电压表设计程序用c语言at89c51 adc0808,51单片机的ADC0808数字电压表设计
- 408计算机考研题型分布,计算机考研:计算机408大纲考点变化解析指导
- 强烈推荐APP破解常用工具集合!最强总结
- “罪魁祸首”已找到,微软回应修改 MIT 开源项目作者版权声明
- 结合量价持仓分析的股指期货日内交易策略
- 在JavaScript中使用Octet Streams
- MSP430F149单片机-IAP升级
- flac格式转mp3
- Ant Design Pro模板无多标签页解决方案
热门文章
- 基于javaweb的自习室图书馆座位预约管理系统(java+ssm+jsp+easyui+mysql)
- 大数据时代来临了,你需要了解什么是大数据
- 《大数据时代:生活、工作与思维的大变革》:看“大数据时代预言家”的真知灼见
- CSU - 2085 手游大佬(天数计算)
- SDKMAN因为网络问题用不了怎么办?
- 用802.1X+FreeRadius+LDAP实现网络准入方案
- python web py入门(1)-web.py简介和安装
- Python爬取京东商品评论数据
- Android存储子系统流程--vold
- 程序员必备的5个工作技能