第一篇博客,python爬取淘宝信息
python爬取淘宝信息
本人只是刚学python的菜鸟,代码不规范及需改进的地方请指教
我们直接看代码吧!哈哈
import requests
from bs4 import BeautifulSoup
headers = {'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64; rv:70.0) Gecko/20100101 Firefox/70.0'}
url = "https://list.tmall.com/search_product.htm?q=%CA%D6%BB%FA&type=p&vmarket=&spm=a211oj.0.a2227oh.d100&from=..pc_1_searchbutton"
res = requests.get(url=url, headers=headers)
soup = BeautifulSoup(res.text, 'html.parser')
xml = soup.find_all('p', class_="productTitle")
xml1 = soup.find_all('p', class_='productPrice')
xml2 = soup.find_all('a', class_='productShop-name')
for i in range(len(xml)):name = xml[i].get_text()price = xml1[i].get_text()shop = xml2[i].get_text()a = name.replace('\n', '')b = price.replace('\n', '')c = shop.replace('\n', '')d = a + " " + b + " " + c + '\n'with open('222.txt', 'a+', encoding='utf-8') as f:f.write(d)
此段代码爬取的信息是淘宝搜索手机界面,关于商品名称、价格、店铺的信息。
小弟不才,我是一枚测试工程师,对python略感兴趣,所以学习了一下,不规范之处还请多指教,谢谢各位啦!!!!
爬取信息如上图所示
bs4库使用参考链接:bs4库的使用
第一篇博客,python爬取淘宝信息相关推荐
- 用Python爬取淘宝网商品信息
用Python爬取淘宝网商品信息 转载请注明出处 网购时经常会用到淘宝网 点我去淘宝但淘宝网上的商品琳琅满目,于是我参照中国大学 MOOC的代码写了一个爬取淘宝网商品信息的程序 代码如下: impor ...
- python爬淘宝app数据_一篇文章教会你用Python爬取淘宝评论数据(写在记事本)
[一.项目简介] 本文主要目标是采集淘宝的评价,找出客户所需要的功能.统计客户评价上面夸哪个功能多,比如防水,容量大,好看等等. [二.项目准备工作] 准备Pycharm,下载安装等,可以参考这篇文章 ...
- python 爬取淘宝网课
python爬取淘宝网课,打开web控制台,发现有个链接可以下载到对应的内容,下载的格式是m3u8,用文本打开里面是许多.ts链接,当然百度后得知可以直接下个vlc然后下载,但是还是想用python试 ...
- python爬取淘宝商品图片
python爬取淘宝商品的图片 话不多说,直接上代码: from selenium import webdriver from selenium.webdriver.common import key ...
- Python爬取淘宝女模特信息
前言 Python爬取淘宝美女信息下载本地并同时存储mysql数据库,存储数据库用到了pymysql模块,sql语句简单好用,直接上代码,源码请点链接Python-Spiders文集. 项目结构: 本 ...
- python不登陆爬取淘宝数据_python登录并爬取淘宝信息代码示例
本文主要分享关于python登录并爬取淘宝信息的相关代码,还是挺不错的,大家可以了解下. #!/usr/bin/env python # -*- coding:utf-8 -*- from selen ...
- python电商数据挖掘_利用Python爬取淘宝商品并数据挖掘与分析实战!此乃大型项目!...
项目内容 本案例选择>> 商品类目:沙发: 数量:共100页 4400个商品: 筛选条件:天猫.销量从高到低.价格500元以上. 项目目的 1. 对商品标题进行文本分析 词云可视化 2. ...
- 如何使用selenium自动化爬取淘宝信息
如何使用自动化爬取淘宝信息 1.首先我们要确保安装了谷歌浏览器,并且是84.0版本 因为接下来我们要用到自动化这款软件,必须得和版本相匹配,否则就会失败 2.然后接下来,打开我们的taobao文件选择 ...
- python 爬取淘宝第一弹(淘宝登录)
前言 2018年7月份,当时我正在学习爬虫,看过一个教程视频是用selenium爬取淘宝,当时因为种种原因(当然还是因为自己太lan)没有去写,但当11月份想找工作时,想找一个爬虫练手,能够写上简历充 ...
最新文章
- Image Filters for IOS
- 应用Java程序片段动态生成表格
- 2020 ICPC NAC
- 支持在iPad中播放的HTML5视频网站推荐
- python matplotlib画图遇到的问题——标题重叠问题
- 谷歌详述 Zoom 客户端和MMR 服务器中的两个0day
- CMake 使用总结(转载)
- Rejected connection from xx.xx.xx.xx, address already has the configured maximum of 10 connections
- 如何将LaTeX公式拷贝到Word中
- Hexo博客使用友盟+CNZZ统计页面访问次数
- WebRTC源码分析四:视频模块结构
- 设备树使用手册【转】
- 安卓源码避坑指南10—蓝牙音乐播放状态和歌曲信息不更新
- 谈谈市场上常用语音芯片方案选型,录音芯片方案选型
- 外包程序员,如何提高自己跳出外包圈子?
- BUUCTF栈迁移ciscn_2019_es_2
- smi时序_详解芯片组上电时序.ppt
- BZOJ 1430 小猴打架
- 【数据集】中国各类水文专业常用数据集合集
- php pcntl fork使用,php中pcntl_fork详解
热门文章
- 因为一顿饭,我被隔离了
- php几级栏目联动,php实现二级联动菜单
- vs2019web网站从创建到发布
- 雪球产品期权价值蒙特卡洛模拟(2)
- c语言阶码的位数,【判断题】浮点数的取值范围由阶码的位数决定,而精度由尾数的位数决定。 (1.0分)...
- 警惕小广告联盟,别让蝇头小利败坏了网站
- 获取设备及硬件信息(尤其平板或者大的广告屏幕)
- 八字得令得地得势--论六亲第5节
- 2023FHC上海环球食品展
- C# 弹出窗口 show()和showdialog()