python爬取淘宝信息

本人只是刚学python的菜鸟,代码不规范及需改进的地方请指教

我们直接看代码吧!哈哈

import requests
from bs4 import BeautifulSoup
headers = {'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64; rv:70.0) Gecko/20100101 Firefox/70.0'}
url = "https://list.tmall.com/search_product.htm?q=%CA%D6%BB%FA&type=p&vmarket=&spm=a211oj.0.a2227oh.d100&from=..pc_1_searchbutton"
res = requests.get(url=url, headers=headers)
soup = BeautifulSoup(res.text, 'html.parser')
xml = soup.find_all('p', class_="productTitle")
xml1 = soup.find_all('p', class_='productPrice')
xml2 = soup.find_all('a', class_='productShop-name')
for i in range(len(xml)):name = xml[i].get_text()price = xml1[i].get_text()shop = xml2[i].get_text()a = name.replace('\n', '')b = price.replace('\n', '')c = shop.replace('\n', '')d = a + "    " + b + "    " + c + '\n'with open('222.txt', 'a+', encoding='utf-8') as f:f.write(d)

此段代码爬取的信息是淘宝搜索手机界面,关于商品名称、价格、店铺的信息。

小弟不才,我是一枚测试工程师,对python略感兴趣,所以学习了一下,不规范之处还请多指教,谢谢各位啦!!!!
爬取信息如上图所示
bs4库使用参考链接:bs4库的使用

第一篇博客,python爬取淘宝信息相关推荐

  1. 用Python爬取淘宝网商品信息

    用Python爬取淘宝网商品信息 转载请注明出处 网购时经常会用到淘宝网 点我去淘宝但淘宝网上的商品琳琅满目,于是我参照中国大学 MOOC的代码写了一个爬取淘宝网商品信息的程序 代码如下: impor ...

  2. python爬淘宝app数据_一篇文章教会你用Python爬取淘宝评论数据(写在记事本)

    [一.项目简介] 本文主要目标是采集淘宝的评价,找出客户所需要的功能.统计客户评价上面夸哪个功能多,比如防水,容量大,好看等等. [二.项目准备工作] 准备Pycharm,下载安装等,可以参考这篇文章 ...

  3. python 爬取淘宝网课

    python爬取淘宝网课,打开web控制台,发现有个链接可以下载到对应的内容,下载的格式是m3u8,用文本打开里面是许多.ts链接,当然百度后得知可以直接下个vlc然后下载,但是还是想用python试 ...

  4. python爬取淘宝商品图片

    python爬取淘宝商品的图片 话不多说,直接上代码: from selenium import webdriver from selenium.webdriver.common import key ...

  5. Python爬取淘宝女模特信息

    前言 Python爬取淘宝美女信息下载本地并同时存储mysql数据库,存储数据库用到了pymysql模块,sql语句简单好用,直接上代码,源码请点链接Python-Spiders文集. 项目结构: 本 ...

  6. python不登陆爬取淘宝数据_python登录并爬取淘宝信息代码示例

    本文主要分享关于python登录并爬取淘宝信息的相关代码,还是挺不错的,大家可以了解下. #!/usr/bin/env python # -*- coding:utf-8 -*- from selen ...

  7. python电商数据挖掘_利用Python爬取淘宝商品并数据挖掘与分析实战!此乃大型项目!...

    项目内容 本案例选择>> 商品类目:沙发: 数量:共100页 4400个商品: 筛选条件:天猫.销量从高到低.价格500元以上. 项目目的 1. 对商品标题进行文本分析 词云可视化 2. ...

  8. 如何使用selenium自动化爬取淘宝信息

    如何使用自动化爬取淘宝信息 1.首先我们要确保安装了谷歌浏览器,并且是84.0版本 因为接下来我们要用到自动化这款软件,必须得和版本相匹配,否则就会失败 2.然后接下来,打开我们的taobao文件选择 ...

  9. python 爬取淘宝第一弹(淘宝登录)

    前言 2018年7月份,当时我正在学习爬虫,看过一个教程视频是用selenium爬取淘宝,当时因为种种原因(当然还是因为自己太lan)没有去写,但当11月份想找工作时,想找一个爬虫练手,能够写上简历充 ...

最新文章

  1. Image Filters for IOS
  2. 应用Java程序片段动态生成表格
  3. 2020 ICPC NAC
  4. 支持在iPad中播放的HTML5视频网站推荐
  5. python matplotlib画图遇到的问题——标题重叠问题
  6. 谷歌详述 Zoom 客户端和MMR 服务器中的两个0day
  7. CMake 使用总结(转载)
  8. Rejected connection from xx.xx.xx.xx, address already has the configured maximum of 10 connections
  9. 如何将LaTeX公式拷贝到Word中
  10. Hexo博客使用友盟+CNZZ统计页面访问次数
  11. WebRTC源码分析四:视频模块结构
  12. 设备树使用手册【转】
  13. 安卓源码避坑指南10—蓝牙音乐播放状态和歌曲信息不更新
  14. 谈谈市场上常用语音芯片方案选型,录音芯片方案选型
  15. 外包程序员,如何提高自己跳出外包圈子?
  16. BUUCTF栈迁移ciscn_2019_es_2
  17. smi时序_详解芯片组上电时序.ppt
  18. BZOJ 1430 小猴打架
  19. 【数据集】中国各类水文专业常用数据集合集
  20. php pcntl fork使用,php中pcntl_fork详解

热门文章

  1. 因为一顿饭,我被隔离了
  2. php几级栏目联动,php实现二级联动菜单
  3. vs2019web网站从创建到发布
  4. 雪球产品期权价值蒙特卡洛模拟(2)
  5. c语言阶码的位数,【判断题】浮点数的取值范围由阶码的位数决定,而精度由尾数的位数决定。 (1.0分)...
  6. 警惕小广告联盟,别让蝇头小利败坏了网站
  7. 获取设备及硬件信息(尤其平板或者大的广告屏幕)
  8. 八字得令得地得势--论六亲第5节
  9. 2023FHC上海环球食品展
  10. C# 弹出窗口 show()和showdialog()