先码为敬
import requests
import re
def getHTMLText(url)://这里已经入门python爬虫的应该都知道了,这就是个爬取阿里商品全部信息的函数
    try:
        r=requests.get(url,timeout=30)
        r.raise_for_status()
        r.encoding=r.apparent_encoding
        return r.text
    except:
        return 'error'
def parsePage(ilt,html)://这个函数就是利用正则表达式从获取到的信息里面筛选需要的信息
    try:
        plt=re.findall(r'\"strPriceMoney\"\:\"[\d\.]*\"',html)//这里利用正则表达式进行信息匹配
        tlt=re.findall(r'\"title\"\:\".*?\"',html)
        for i in range(len(plt)):
            price=eval(plt[i].split(':')[1])
            title1=eval(tlt[i].split(':')[1])
            title=re.sub(r'<.*?>','',title1)\\这一段是利用正则表达式去除获取字符串里的标签信息
            ilt.append([price,title])
    except:
        print('error')
def printGoodsList(ilt)://这个函数就是将获取需要的信息进行打印输出
    tplt='{:4}\t{:8}\t{:16}'
    print(tplt.format('序号','价格','商品名称'))
    count=0
    for i in ilt:
        count+=1
        print(tplt.format(count,i[0],i[1]))

def main()://主函数进行调用控制其他函数功能
    goods='电脑'
    start_url='https://p4psearch.1688.com/p4p114/p4psearch/offer.htm?spm=a2609.11209760.it2i6j8a.6.50832de1NZAXIF&cosite=qqdaohang&keywords='+goods
    infoList=[]
    try:
        url=start_url
        html=getHTMLText(url)
        parsePage(infoList,html)
        printGoodsList(infoList)
    except:
        print('error')
main()
这段代码本来是在mooc上学习到的,但当时是用来爬取淘宝信息的,但现在淘宝要登录,我怕被封号^_^,就自己修改了一些内容从而来爬取阿里的商品信息

简单爬取阿里巴巴商品信息相关推荐

  1. 简单爬虫,爬取天猫商品信息

    前言 这是我第一次用Java来写爬虫项目,研究的也不是很透彻,所以爬虫技术的理论方面的就不说太多了. 主要还是以如何爬取商品信息为主,爬取最简单的商品信息,给出大概的思路和方法. 对于没有反爬技术的网 ...

  2. Selenium介绍--实例爬取京东商品信息与图片

    目录 一.Selenium简介 二.Selenium组成 三.Selenium特点 四.Selenium的基本使用 1.下载所用浏览器需要的驱动 2.创建项目并导入依赖 3.入门 3.代码演示 五.实 ...

  3. go爬虫和python爬虫哪个好_python 爬虫实战项目--爬取京东商品信息(价格、优惠、排名、好评率等)-Go语言中文社区...

    利用splash爬取京东商品信息 一.环境 window7 python3.5 pycharm scrapy scrapy-splash MySQL 二.简介 为了体验scrapy-splash 的动 ...

  4. layui获取input信息_python爬虫—用selenium爬取京东商品信息

    python爬虫--用selenium爬取京东商品信息 1.先附上效果图(我偷懒只爬了4页) 2.京东的网址https://www.jd.com/ 3.我这里是不加载图片,加快爬取速度,也可以用Hea ...

  5. Day06,selenium的剩余用法、万能登录破解和爬取京东商品信息,及破解极验滑动验证码...

    一.自动登录抽屉新热榜 from selenium import webdriver import timedriver = webdriver.Chrome(r'D:\BaiduNetdiskDow ...

  6. python爬取京东商品信息代码_爬取京东商品信息

    利用 BeautifulSoup + Requests 爬取京东商品信息并保存在Excel中 一.查看网页信息 打开京东商城,随便输入个商品,就选固态硬盘吧 先看看 URL 的规律,可以看到我们输入的 ...

  7. python爬虫爬取京东商品评价_python爬取京东商品信息及评论

    ''' 爬取京东商品信息: 功能: 通过chromeDrive进行模拟访问需要爬取的京东商品详情页(https://item.jd.com/100003196609.html)并且程序支持多个页面爬取 ...

  8. python爬取天猫商品信息

    python爬取天猫商品信息 主要信息有:商品名,价格,月销量,评论数,人气值,店铺评分 以智能手机为例! 首先,发掘网址规律: 第二页的网址如上 第三页的网址如上 注意网址中的数字(靠近中间位置): ...

  9. Python爬虫实战,requests+openpyxl模块,爬取手机商品信息数据(附源码)

    前言 今天给大家介绍的是Python爬取手机商品信息数据,在这里给需要的小伙伴们代码,并且给出一点小心得. 首先是爬取之前应该尽可能伪装成浏览器而不被识别出来是爬虫,基本的是加请求头,但是这样的纯文本 ...

最新文章

  1. 计算机视觉的“惨胜”:反思大型图像数据集
  2. SpringBoot运行异常时捕获
  3. php和python写爬虫-为什么选择用python做爬虫
  4. STL 容器简介:C++ 容器:顺序性容器、关联式容器和容器适配器
  5. 写文件 追加到开始_文件和流
  6. Android Spinner填充数据后设置默认值的问题
  7. 使用git checkout的方式进行轻量级部署
  8. [安全攻防进阶篇] 八.那些年的熊猫烧香及PE病毒行为机理分析
  9. matlab切片操作
  10. viper12a电源电路图_viper12_viper12a工作原理详解_简单viper12a电路图
  11. C#.NET彩票数据分析
  12. 《Netty实战》总结
  13. python基本函数的导数公式_算法中的微积分:5大函数求导公式让你在面试中脱颖而出...
  14. 国内网通、电信代理服务器地址
  15. python中sub函数用法_Python pandas.DataFrame.sub函数方法的使用
  16. 搜索结果Refinement 行为总结之 multi-selection refinement
  17. Java11引用org.w3c.dom 时报错The package org.w3c.dom is accessible from more than one module: , java.xml
  18. 聚焦智改数转,长沙博世“灯塔工厂”出圈史
  19. 微信撤回软件安卓版_微信拍一拍撤回软件下载
  20. 基于Java+Spring的图书管理系统详细设计和实现

热门文章

  1. mac 系统office软件
  2. IEEE Fellow 2020华人占比下降:京东周伯文、滴滴叶杰平入选,清华校友6人
  3. Windows编译开源代码方法之关于lame.exe文件的测试及过程
  4. java毕业生设计作业批改管理系统计算机源码+系统+mysql+调试部署+lw
  5. GBase 8s V8.8 SQL 指南:教程-5.1.1
  6. 2023ssm基于微信小程序的家校通系统-JAVA.VUE(论文+开题报告+运行)
  7. 用字典建立一个通讯录,向字典中添加和删除通讯人(名字、电话、邮箱、工作单位等),查询某个人的信息,然后输出通讯录中所有人的信息。
  8. python期货交易策略_GitHub - guyimin/tqsdk-python: 期货量化交易策略程序开发包, 实时行情/历史数据/实盘交易...
  9. 你早该这么玩Excel 读书笔记
  10. Lexar 雷克沙新款固态硬盘发布,高性能首选