前言

最近有厂商提出想把天猫店铺的数据拿到后台ERP管理系统中,并能实现线下打印电子面单功能。接手这个需求按照度娘给的指引,申请天猫开发者帐号,但是。。。大厂把订单传送接口关了,只对厂商自研软件开放,还需要租用聚石塔。一系列操作真是上天了,没办法走通,最后没办法采用数据抓取方式曲线救国。

实现思路

1、由用户手工登录淘宝店铺,通过解密GOOGLE-COOKIES得到淘宝网站登录中的cookies。2、通过cookies对淘宝订单网页自动定时下载订单数据。3、解析订单数据含义,其中包含商品信息、物流信息、订单号、客户手机号、地址等重要信息保存。4、与本地业务系统对比进行插入保存,包含退货信息。5、开通快递鸟接口,实现电子面单打印。

代码片段参考

1、WINDOWS环境解密COOKIES,获取正确的COOKIESChrome的Cookie默认是加密的,是一个SQLite3文件,根据不同的操作系统位于https://chromium.googlesource.com/chromium/src/+/master/docs/user_data_dir.md所述的路径中,例如:C:\Users\Alice\AppData\Local\Google\Chrome\User Data\Default\Cookies。这里特别感谢http://www.meilongkui.com/archives/1904文章大神,从本质上解决了问题,并且还分别讲述了V10和V11解决问题办法。首先我们按照SQLITE连接方式取出加密Cookies

通过解密方法获取正确Cookies

接下来我们设置定时器,隔XX秒通过天猫数据地址加上上面COOKIES抓取数据,注意间隔时间不能太短,并且间隔时间如果能设置一个随机数更好,避免被列为异常网站,打入冷宫,需要手机或滑动条验证等问题,例如https://trade.taobao.com/trade/itemlist/list_sold_items.htm

其中抓取数据注意HTTP头设置。

最后我们通过抓取数据进行分析保存。

其中会包含购买用户信息,商品信息,库存信息,物流信息等。

最后说下电子面单的实现过程。1、我们登录快递鸟申请免费KEY,并通知客户申请对应快递客户号(部分不用)。快递鸟提供了对应电子面单开发文档,开发例程,接口测试等,比较方便,并且免费。

2、使用官方调用示例改造即可

笔者采用的是JAVA Application无界面BAT启动JAR包形式数据抓取,最后实现效果如下。

时间仓促,写的比较简单,欢迎交流!

源码获取加群:850591259

实现从淘宝定时抓取订单数据、打印电子面单并保存到ERP表中!相关推荐

  1. 实现从淘宝(天猫)定时抓取订单数据、打印电子面单并保存到ERP表中

    实现从淘宝(天猫)定时抓取订单数据.打印电子面单并保存到ERP表中 前言 实现思路 代码片段参考 前言 最近有厂商提出想把天猫店铺的数据拿到后台ERP管理系统中,并能实现线下打印电子面单功能.接手这个 ...

  2. 阿里系-淘宝接口抓取

    阿里系-淘宝接口抓取 一.安装charlse抓包工具 官方下载地址 安装证书 二.安装xposed hook框架 Xponsed简介 具体安装步骤 三.安装模块 关闭阿里系ssl验证 开启http模式 ...

  3. 阿里系-淘宝接口抓取及相关问题

    阿里系-淘宝接口抓取 一.安装charlse抓包工具 官方下载地址 安装证书 二.安装xposed hook框架 Xponsed简介 具体安装步骤 三.安装模块 关闭阿里系ssl验证 开启http模式 ...

  4. 淘宝(tmall)抓取店铺订单解密数据、打印电子面单、订单推送保存到erp软件中

    前言 最近有厂商提出想把淘宝(tmall)店铺的卖出的订单详情数据采集到后台ERP管理系统中,并能实现线下打印电子面单功能.接手这个需求按照度娘给的指引,申请淘宝(tmall)开发者帐号,但是...开 ...

  5. 项目进展:淘宝店铺抓取

    1.概要: 项目为了抓取淘宝中可能存在的侵犯明星肖像权的行为,目标获取店铺首页的图片 淘宝店铺首页:https://shopsearch.taobao.com/search?app=shopsearc ...

  6. Python自动登陆淘宝并爬取商品数据

    前言 本文的文字及图片来源于网络,仅供学习.交流使用,不具有任何商业用途,如有问题请及时联系我们以作处理. 基本开发环境 Python 3.6 Pycharm import time from sel ...

  7. Scrapy框架学习 - 爬取豆瓣电影排行榜TOP250所有电影信息并保存到MongoDB数据库中

    概述 利用Scrapy爬取豆瓣电影Top250排行榜电影信息,并保存到MongoDB数据库中 使用pymongo库操作MOngodb数据库 没有进行数据清洗 源码 items.py class Dou ...

  8. 淘宝/天猫seller_order_list-获取卖出的商品订单列表接口接入解决方案

    一.淘宝/天猫seller_order_list-获取卖出的商品订单列表接口API 返回值说明 点击注册获取key和secret测试账号 提取淘宝天猫店铺卖家账号买到的订单编号,订单金额,订单详情等, ...

  9. Python爬虫实战(5):模拟登录淘宝并获取所有订单

    Python爬虫入门(1):综述 Python爬虫入门(2):爬虫基础了解 Python爬虫入门(3):Urllib库的基本使用 Python爬虫入门(4):Urllib库的高级用法 Python爬虫 ...

最新文章

  1. 【数据库】sqlite3常用命令及SQL语句
  2. HTML POST提交参数给PHP并返回json,上传execl文件
  3. 看我如何拿下公司OA服务器
  4. 源路由 小实验 小发现
  5. 浙大三维视觉团队提出Animatable NeRF,从RGB视频中重建可驱动人体模型 (ICCV'21)
  6. 从零开始学python | 使用Python映射,过滤和缩减函数:所有您需要知道的
  7. 吴恩达深度学习2.1练习_Improving Deep Neural Networks(Initialization_Regularization_Gradientchecking)
  8. 深入理解JAVA虚拟机大全
  9. 真香警告!java时间格式转换工具
  10. Deep Retinex Decomposition for Low-LightEnhancement (2018 BMCV,含代码)
  11. js自定义函数传参(字符串)问题
  12. 【学习感悟】找工作之前的焦虑
  13. MAC系统中快速切换输入法的方法
  14. 记一次hydra密码破解神器的学习
  15. 检测到u盘但是计算机没有反应,u盘插上电脑没反应,教您修复无法识别u盘问题...
  16. Wormhole漏洞分析
  17. 国防科大计算机学院贾焰,国防科大教师中院士顶级选手
  18. 透析SpringBoot jar可执行原理
  19. 如何实现国外域名调转到国内已备案ip
  20. 【Unity学习笔记】标签(Tag)和层(Layer)

热门文章

  1. swagger中paramType请求类型为body
  2. 麦肯锡精英的39个工作习惯
  3. python 限定数据范围_Python 生成周期性波动的数据 可指定数值范围2
  4. oracle语句中dual什么意思,oracle中dual详解
  5. linux学习笔记三: secureCRT小键盘输入数字键的时候,出现字母的解决方法:
  6. dns的基本设定(一)
  7. db2 修改表空间自增长_db2自动调整表空间的大小 - 木子日京的个人空间 - 51Testing软件测试网 51Testing软件测试网-软件测试人的精神家园...
  8. [十月往昔]——Linux内核中的list.h浅谈
  9. 华为云Stack在政务云市场,稳!
  10. 大数据应用分析解决方案----图书出版