目录

使用教程

演示图片

简易源码分享

总结


我和女友是19年在和平精英上认识的,在这之前我已经单身了3年,虽然大家都说电子竞技不需要爱情,但是我幸运,遇到了现在女朋友,本来一个宅男硬生生的被她改变成了在路上也会有小妹妹问我要微信,但是我是很爱我女朋友的,一个都没有要,嘿嘿 女朋友照片镇楼

使用教程

  1. 点击这里下载下载chrome浏览器
  2. 查看chrome浏览器的版本号,点击这里下载对应版本号的chromedriver驱动
  3. pip安装下列包
    • pip install selenium
    • pip install pyquery
  4. 点击这里登录微博,并通过微博绑定淘宝账号密码
  5. 在main中填写chromedriver的绝对路径
  6. 在main中填写微博账号密码
#改成你的chromedriver的完整路径地址
chromedriver_path = "/Users/bird/Desktop/chromedriver.exe"
#改成你的微博账号
weibo_username = "改成你的微博账号"
#改成你的微博密码
weibo_password = "改成你的微博密码"

演示图片

简易源码分享

# -*- coding: utf-8 -*-from selenium import webdriver
from selenium.webdriver.common.by import By
from selenium.webdriver.support.ui import WebDriverWait
from selenium.webdriver.support import expected_conditions as EC
from pyquery import PyQuery as pq
from time import sleep
import random#定义一个taobao类
class taobao_infos:#对象初始化def __init__(self):url = 'https://login.taobao.com/member/login.jhtml'self.url = urloptions = webdriver.ChromeOptions()options.add_experimental_option("prefs", {"profile.managed_default_content_settings.images": 2}) # 不加载图片,加快访问速度options.add_experimental_option('excludeSwitches', ['enable-automation']) # 此步骤很重要,设置为开发者模式,防止被各大网站识别出来使用了Seleniumself.browser = webdriver.Chrome(executable_path=chromedriver_path, options=options)self.wait = WebDriverWait(self.browser, 10) #超时时长为10s#登录淘宝def login(self):# 打开网页self.browser.get(self.url)# 自适应等待,点击密码登录选项self.browser.implicitly_wait(30) #智能等待,直到网页加载完毕,最长等待时间为30sself.browser.find_element_by_xpath('//*[@class="forget-pwd J_Quick2Static"]').click()# 自适应等待,点击微博登录宣传self.browser.implicitly_wait(30)self.browser.find_element_by_xpath('//*[@class="weibo-login"]').click()# 自适应等待,输入微博账号self.browser.implicitly_wait(30)self.browser.find_element_by_name('username').send_keys(weibo_username)# 自适应等待,输入微博密码self.browser.implicitly_wait(30)self.browser.find_element_by_name('password').send_keys(weibo_password)# 自适应等待,点击确认登录按钮self.browser.implicitly_wait(30)self.browser.find_element_by_xpath('//*[@class="btn_tip"]/a/span').click()# 直到获取到淘宝会员昵称才能确定是登录成功taobao_name = self.wait.until(EC.presence_of_element_located((By.CSS_SELECTOR, '.site-nav-bd > ul.site-nav-bd-l > li#J_SiteNavLogin > div.site-nav-menu-hd > div.site-nav-user > a.site-nav-login-info-nick ')))# 输出淘宝昵称print(taobao_name.text)# 模拟向下滑动浏览def swipe_down(self,second):for i in range(int(second/0.1)):#根据i的值,模拟上下滑动if(i%2==0):js = "var q=document.documentElement.scrollTop=" + str(300+400*i)else:js = "var q=document.documentElement.scrollTop=" + str(200 * i)self.browser.execute_script(js)sleep(0.1)js = "var q=document.documentElement.scrollTop=100000"self.browser.execute_script(js)sleep(0.1)# 爬取淘宝 我已买到的宝贝商品数据def crawl_good_buy_data(self):# 对我已买到的宝贝商品数据进行爬虫self.browser.get("https://buyertrade.taobao.com/trade/itemlist/list_bought_items.htm")# 遍历所有页数for page in range(1,1000):# 等待该页面全部已买到的宝贝商品数据加载完毕good_total = self.wait.until(EC.presence_of_element_located((By.CSS_SELECTOR, '#tp-bought-root > div.js-order-container')))# 获取本页面源代码html = self.browser.page_source# pq模块解析网页源代码doc = pq(html)# # 存储该页已经买到的宝贝数据good_items = doc('#tp-bought-root .js-order-container').items()# 遍历该页的所有宝贝for item in good_items:good_time_and_id = item.find('.bought-wrapper-mod__head-info-cell___29cDO').text().replace('\n',"").replace('\r',"")good_merchant = item.find('.seller-mod__container___1w0Cx').text().replace('\n',"").replace('\r',"")good_name = item.find('.sol-mod__no-br___1PwLO').text().replace('\n', "").replace('\r', "")# 只列出商品购买时间、订单号、商家名称、商品名称# 其余的请自己实践获取print(good_time_and_id, good_merchant, good_name)print('\n\n')# 大部分人被检测为机器人就是因为进一步模拟人工操作# 模拟人工向下浏览商品,即进行模拟下滑操作,防止被识别出是机器人# 随机滑动延时时间swipe_time = random.randint(1, 3)self.swipe_down(swipe_time)# 等待下一页按钮 出现good_total = self.wait.until(EC.presence_of_element_located((By.CSS_SELECTOR, '.pagination-next')))# 点击下一页按钮good_total.click()sleep(2)if __name__ == "__main__":# 使用之前请先查看当前目录下的使用说明文件README.MD# 使用之前请先查看当前目录下的使用说明文件README.MD# 使用之前请先查看当前目录下的使用说明文件README.MDchromedriver_path = "/Users/bird/Desktop/chromedriver.exe" #改成你的chromedriver的完整路径地址weibo_username = "改成你的微博账号" #改成你的微博账号weibo_password = "改成你的微博密码" #改成你的微博密码a = taobao_infos()a.login() #登录a.crawl_good_buy_data() #爬取淘宝 我已买到的宝贝商品数据

总结


 小编这边也准备了一些比较合适新手和刚学习Python的小伙伴的学习资料,欢迎进群自行下载哦

咱们讨论交流裙账号是:881744585 有学习视频、画图源码、游戏源码、电子书籍以及大厂的面试笔试题,希望大家的努力都不负所望,收入越来越多。 学习交流的地方,广告勿加【否则你做什么就亏什么,永远赚不到钱】

爬取女朋友用我淘宝已购买的宝贝数据,发现了她特殊的秘密...相关推荐

  1. 爬取女友淘宝已购买的宝贝数据,发现了她特殊的秘密...

    前言 我相信很多人都好奇女朋友会在淘宝上买过什么稀奇古怪的小东西!反正我是挺好奇的,如果当着她的面拿着手机刷购买记录,她肯定是不肯的!毕竟谁还没有一点小秘密了,那么今天就教你如何一键抓取记录信息,发现 ...

  2. Python 利用 cookie 模拟登录,爬取指定关键词的淘宝商品信息

    Python 利用 cookie 模拟登录,爬取指定关键词的淘宝商品信息-Selenium 1. 本文目标 由于淘宝网站的不断更新,以前的爬取方法都无法重现,必须需要登录淘宝网站才可以进行搜索商品.所 ...

  3. 使用dumuz软件机器人获取淘宝已买的宝贝下载和物流信息

    应用功能描述 模拟人工操作淘宝"已买的宝贝"网页,淘宝买家可以从已买的宝贝中,批量查询获取淘宝已买宝贝的数据,可根据查询条件获取后,导出生成EXCEL. 操作步骤演示  在应用列表 ...

  4. 闲鱼爬虫 闲鱼爬取 批量搬运上架淘宝软件,闲鱼.上架淘宝辅助软件批量改价/改库存/改标题,批量采集店铺店铺,全店宝贝采集,批量采集店铺高销量自动加水印

    提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档 原理是安卓逆向,通过Hock技术,获取某.鱼店铺所有宝贝信息. 前段时间自己做了一个爬取某鱼店铺的软件,输入淘口令,输出整个店铺的宝贝 ...

  5. 爬虫(利用正则表达式爬取百度新闻(淘宝))

    先直接在百度新闻中搜索"淘宝" 得到url = """ https://www.baidu.com/s?ie=utf-8&medium=0&a ...

  6. 表哥用Python爬取数千条淘宝商品数据后,发现淘宝这些潜规则!

    本文记录了笔者用 Python 爬取淘宝某商品的全过程,并对商品数据进行了挖掘与分析,最终得出结论. 项目内容 本案例选择商品类目:沙发. 数量:共 100 页  4400 个商品. 筛选条件:天猫. ...

  7. 淘宝API接口,Onebound数据

    一.淘宝API接口 详情界面 item_get获得淘宝商品详情 item_get_app获得淘宝app商品详情原数据 item_get_pro获得淘宝商品详情高级版 item_review获得淘宝商品 ...

  8. 获取各大电商平台,item_get_app - 获得淘宝app商品详情原数据API返回数据说明

    今天跟大家分享的是item_get_app - 获得淘宝app商品详情原数据API返回数据说明 item_get_app  获得淘宝商品详情 [查看演示] API测试工具 注册链接(获取Key和sec ...

  9. 极客日报:中国批准AMD收购赛灵思;微信可直接打开淘宝链接购买商品;​马斯克称今年将实现全自动驾驶

    一分钟速览新闻点! 中国附加限制性条件批准AMD收购赛灵思 张一鸣再退出多家字节跳动关联公司职务 腾讯计划对斗鱼进行私有化 2022职场摸鱼报告:超9成年轻人平时工作会摸鱼 微信可直接打开淘宝链接购买 ...

最新文章

  1. 学习笔记17-C语言-结构、联合、枚举
  2. 【linux系统学习笔记】linux基本操作
  3. 如何获取中间层的结果_如何从0开始做大数据治理(上)
  4. python中unicode编码表_python中的unicode编码
  5. SSH三大框架的整合(实例)
  6. 科来网络全流量安全分析系统[Study]
  7. juce开发vst配置
  8. WIN10的桌面和虚拟桌面的切换快捷键太方便了
  9. 关系数据库——关系操作关系模型的完整性
  10. win10 uwp 录制任意应用屏幕
  11. 心电图特效代码 html5,用canvas画心电图的示例代码
  12. chrome浏览器改为黑色背景
  13. 利用python绘制简易词云图(使用jieba进行中文分词)
  14. 中国最年轻的亿万富翁_我和一个亿万富翁一起吃饭。 他给我的建议是无价的。
  15. 有哪些可以快速回复信息的软件
  16. js关闭当前页面 并 刷新主页面
  17. JeecgBoot关于websocket的改进方案
  18. 变步长龙格库塔法matlab代码,matlab龙格库塔法变步长龙格库塔法.doc
  19. 【Hadoop】运行MR任务,出现Container is running beyond physical memory limits错误
  20. pytorch Glove 下载到使用

热门文章

  1. 解决ngress-nginx-controller 报错问题
  2. CSP-J CSP-S 初赛模拟题
  3. layui外部引入_layui use 定义js外部引用函数的方法
  4. python异常-TypeError: ‘tuple‘ object is not callable.当不同的环境下同一个语句运行结果不同时,不如重启程序、更改不相关变量试试
  5. 西门子Wincc/Step7/pcs7
  6. 一年后反思我的围棋经历
  7. 自动批量处理人像照片
  8. 笔试题-2023-思远半导体-数字IC设计【纯净题目版】
  9. Vue进阶(幺肆捌):Vuex 辅助函数详解
  10. x265-1.8版本-common/lowres.cpp注释