前言

随着互联网时代的到来,人们更加倾向于互联网购物。某宝又是电商行业的巨头,在某宝平台中有很多商家数据。

今天带大家使用python+selenium工具获取这些公开的

适合人群:

Python零基础、对爬虫数据采集感兴趣的同学!

环境介绍:

python 3.6

pycharm

selenium

time

1、安装selenium模块

pip install selenium

2、请求网页地址

if __name__ == '__main__':

keyword = input('请输入你要查询的商品数据:')

driver = webdriver.Chrome()

driver.get('https://www.taobao.com')

main()

def search_product(key):

"""模拟搜索商品,获取最大页数"""

driver.find_element_by_id('q').send_keys(key)  # 根据id值找到搜索框输入关键字

driver.find_element_by_class_name('btn-search').click()  # 点击搜索案例

driver.maximize_window()  # 最大化窗口

time.sleep(15)

page = driver.find_element_by_xpath('//*[@id="mainsrp-pager"]/div/div/div/div[1]')  # 获取页数的标签

page = page.text  # 提取标签的文字

page = re.findall('(\d+)', page)[0]

# print(page)

return int(page)

4、获取商品数据

def get_product():

divs = driver.find_elements_by_xpath('//div[@class="items"]/div[@class="item J_MouserOnverReq  "]')

for div in divs:

info = div.find_element_by_xpath('.//div[@class="row row-2 title"]/a').text  # 商品名称

price = div.find_element_by_xpath('.//strong').text + '元'  # 商品价格

deal = div.find_element_by_xpath('.//div[@class="deal-cnt"]').text  # 付款人数

name = div.find_element_by_xpath('.//div[@class="shop"]/a').text  # 店铺名称

print(info, price, deal, name, sep='|')

with open('data.csv', 'a', newline='') as csvfile:  # newline=''  指定一行一行写入

csvwriter = csv.writer(csvfile, delimiter=',')  # delimiter=','  csv数据的分隔符

csvwriter.writerow([info, price, deal, name])  # 序列化数据,写入csv

def main():

search_product(keyword)

page = get_product()

完整代码如下:

from selenium import webdriver

import time

import re

import csv

def search_product(key):

"""模拟搜索商品,获取最大页数"""

driver.find_element_by_id('q').send_keys(key)  # 根据id值找到搜索框输入关键字

driver.find_element_by_class_name('btn-search').click()  # 点击搜索案例

driver.maximize_window()  # 最大化窗口

time.sleep(15)

page = driver.find_element_by_xpath('//*[@id="mainsrp-pager"]/div/div/div/div[1]')  # 获取页数的标签

page = page.text  # 提取标签的文字

page = re.findall('(\d+)', page)[0]

# print(page)

return int(page)

def get_product():

divs = driver.find_elements_by_xpath('//div[@class="items"]/div[@class="item J_MouserOnverReq  "]')

for div in divs:

info = div.find_element_by_xpath('.//div[@class="row row-2 title"]/a').text  # 商品名称

price = div.find_element_by_xpath('.//strong').text + '元'  # 商品价格

deal = div.find_element_by_xpath('.//div[@class="deal-cnt"]').text  # 付款人数

name = div.find_element_by_xpath('.//div[@class="shop"]/a').text  # 店铺名称

print(info, price, deal, name, sep='|')

with open('data.csv', 'a', newline='') as csvfile:  # newline=''  指定一行一行写入

csvwriter = csv.writer(csvfile, delimiter=',')  # delimiter=','  csv数据的分隔符

csvwriter.writerow([info, price, deal, name])  # 序列化数据,写入csv

def main():

search_product(keyword)

page = get_product()

if __name__ == '__main__':

keyword = input('请输入你要查询的商品数据:')

driver = webdriver.Chrome()

driver.get('https://www.taobao.com')

main()

喜欢的就请关注加点赞

python爬虫实例电商_价值上千元的Python爬虫外包案例,学会你就赚了相关推荐

  1. python爬虫实例电商_如何用代码爬抓电商数据(附淘宝API调用实例)

    原标题:如何用代码爬抓电商数据(附淘宝API调用实例) 欢迎关注天善智能 hellobi.com,我们是专注于商业智能BI,大数据,数据分析领域的垂直社区,学习.问答.求职,一站式搞定! 对商业智能B ...

  2. python爬虫实例电商_利用Python爬虫批量获取电商网站图片

    import requests import re url='https://list.jd.com/list.html?cat=9987,653,655' res=requests.get(url) ...

  3. python爬虫实例电商_Python案例:先爬虫爬取,再分析2000款避孕套,最后得出这个结论...

    在学过了Python爬虫.数据分析之后,曾几何时,这样一个问题一直缠绕着我. Python爬虫能用来干点什么?Python数据分析能不能让这剪不断理还乱的数据变得更有意义? 也许,想来想去,只有用来干 ...

  4. python各种包安装顺序_史上最全的Python包管理工具:Anaconda教程

    事实上Anaconda 和 Jupyter notebook已成为数据分析的标准环境. 简单来说,Anaconda是包管理器和环境管理器,Jupyter notebook 可以将数据分析的代码.图像和 ...

  5. python爬虫实例电商_Python实现爬取并分析电商评论

    现如今各种APP.微信订阅号.微博.购物网站等网站都允许用户发表一些个人看法.意见.态度.评价.立场等信息.针对这些数据,我们可以利用情感分析技术对其进行分析,总结出大量的有价值信息.例如对商品评论的 ...

  6. python学生管理系统用列表_史上最全面的python学生管理系统教程(二)

    序言 这篇我们来讲该软件的数据保存方式,由于想到要简便快捷,所以我采用了sqlite3数据库,该数据库操作简单方便,而且易于管理,并且SQLite是一个进程内的库,实现了自给自足的.无服务器的.零配置 ...

  7. python爬取淘宝商品做数据挖掘_Python 3爬虫 数据清洗与可视化实战 Python数据抓取技术 python3网络爬虫教程书籍 运用Python工具获取电商平台页面数据挖掘书籍...

    A8 书    名:Python 3爬虫 数据清洗与可视化实战 作 译 者:零一,韩要宾,黄园园 出版时间:2018-03 千 字 数:200 版    次:01-01 页    数:212 开   ...

  8. 医药电商、线上药房、连锁药店、用药咨询、药箱补货、药师认证、分销商、合伙人、医生管理、诊所管理、处方药、收银、发票、电子会员卡、门店调拨、提成分销、问诊咨询、积分、顾客、流程图、业务逻辑、营销、优惠

    医药电商.线上药房.连锁药店.用药咨询.药箱补货.药师认证.分销商.合伙人.医生管理.诊所管理.处方药.收银.发票.电子会员卡.门店调拨.提成分销.问诊咨询.积分.顾客.流程图.业务逻辑.营销.优惠 ...

  9. 虾皮跨境电商|shopee店铺上新怎么做到极致?

    Shopee店铺维持一个平稳的上新频率,是能够确保店铺的活跃度,Shopee也会给与大量的流量帮扶的.但是Shopee卖家在上新的情况下,还要了解一些上新方法,才可以使你的新产品得到大量曝出,也使你的 ...

最新文章

  1. 分享6款堪称神器却很少有人知道的软件,让人惊喜!
  2. java判断用户是否在某一个区域登录_Java实现QQ登录和微博第三方登录
  3. git stash pop冲突_这有一份 git 日常使用清单,你需要吗?
  4. 中国妇科冲洗器市场规模现状及投资趋势分析报告2022-2028年版
  5. Java中执行存储过程和函数(web基础学习笔记十四)
  6. 苹果safari浏览器window.open问题
  7. html iframe post,使用Jquery和IFrame的跨子域请求(GET,POST,…)
  8. centos 6.8安装git_RPM包的卸载与安装,包含依赖包卸载
  9. [Kaggle] Digit Recognizer 手写数字识别(神经网络)
  10. python 连续三个数满足条件_计算满足条件的连续值数(Pandas Dataframe)
  11. Magento 架构原则
  12. mysql 日期对比,varchar类型装换为datetime类型
  13. Android开发笔记(一百二十五)自定义视频播放器
  14. [C#] Microsoft .Net框架SerialPort类的用法与示例
  15. TCP新手误区–粘包的处理
  16. python生成折线图怎么对特定点做颜色_python库matplotlib绘制折线图,散点图以及设置样式...
  17. c语言电子时钟课程设计报告,电子时钟嵌入式课程设计报告
  18. linux sqlite图形工具,SQLite 图形化管理工具
  19. 人际关系-《别独自用餐》书中的精髓:通过有效的社交法则,改变社交行为固有模式,建立更有价值的人脉关系,从而获取更大成功。
  20. 答疑解惑!社招与校招有什么区别?

热门文章

  1. 2018第九届蓝桥省赛题目
  2. 《实时控制软件开发》学生四次作业成绩总排名
  3. MFC CTreeCtrl运用
  4. SqlServer索引的原理与应用
  5. android 简易定时器
  6. 【每日进步】May 2012
  7. linux常用svn命令
  8. WPF中splashScreen启动程序之前出现一个过程动画的效果
  9. 贝叶斯统计:Tweedie公式及其证明
  10. R语言数据可视化 ggplot2基础3 添加几何对象