实现从淘宝定时抓取订单数据、打印电子面单并保存到ERP表中!
前言
最近有厂商提出想把天猫店铺的数据拿到后台ERP管理系统中,并能实现线下打印电子面单功能。接手这个需求按照度娘给的指引,申请天猫开发者帐号,但是。。。大厂把订单传送接口关了,只对厂商自研软件开放,还需要租用聚石塔。一系列操作真是上天了,没办法走通,最后没办法采用数据抓取方式曲线救国。
实现思路
1、由用户手工登录淘宝店铺,通过解密GOOGLE-COOKIES得到淘宝网站登录中的cookies。2、通过cookies对淘宝订单网页自动定时下载订单数据。3、解析订单数据含义,其中包含商品信息、物流信息、订单号、客户手机号、地址等重要信息保存。4、与本地业务系统对比进行插入保存,包含退货信息。5、开通快递鸟接口,实现电子面单打印。
代码片段参考
1、WINDOWS环境解密COOKIES,获取正确的COOKIESChrome的Cookie默认是加密的,是一个SQLite3文件,根据不同的操作系统位于https://chromium.googlesource.com/chromium/src/+/master/docs/user_data_dir.md所述的路径中,例如:C:\Users\Alice\AppData\Local\Google\Chrome\User Data\Default\Cookies。这里特别感谢http://www.meilongkui.com/archives/1904文章大神,从本质上解决了问题,并且还分别讲述了V10和V11解决问题办法。首先我们按照SQLITE连接方式取出加密Cookies
通过解密方法获取正确Cookies
接下来我们设置定时器,隔XX秒通过天猫数据地址加上上面COOKIES抓取数据,注意间隔时间不能太短,并且间隔时间如果能设置一个随机数更好,避免被列为异常网站,打入冷宫,需要手机或滑动条验证等问题,例如https://trade.taobao.com/trade/itemlist/list_sold_items.htm
其中抓取数据注意HTTP头设置。
最后我们通过抓取数据进行分析保存。
其中会包含购买用户信息,商品信息,库存信息,物流信息等。
最后说下电子面单的实现过程。1、我们登录快递鸟申请免费KEY,并通知客户申请对应快递客户号(部分不用)。快递鸟提供了对应电子面单开发文档,开发例程,接口测试等,比较方便,并且免费。
2、使用官方调用示例改造即可
笔者采用的是JAVA Application无界面BAT启动JAR包形式数据抓取,最后实现效果如下。
时间仓促,写的比较简单,欢迎交流!
源码获取加群:850591259
实现从淘宝定时抓取订单数据、打印电子面单并保存到ERP表中!相关推荐
- 实现从淘宝(天猫)定时抓取订单数据、打印电子面单并保存到ERP表中
实现从淘宝(天猫)定时抓取订单数据.打印电子面单并保存到ERP表中 前言 实现思路 代码片段参考 前言 最近有厂商提出想把天猫店铺的数据拿到后台ERP管理系统中,并能实现线下打印电子面单功能.接手这个 ...
- 阿里系-淘宝接口抓取
阿里系-淘宝接口抓取 一.安装charlse抓包工具 官方下载地址 安装证书 二.安装xposed hook框架 Xponsed简介 具体安装步骤 三.安装模块 关闭阿里系ssl验证 开启http模式 ...
- 阿里系-淘宝接口抓取及相关问题
阿里系-淘宝接口抓取 一.安装charlse抓包工具 官方下载地址 安装证书 二.安装xposed hook框架 Xponsed简介 具体安装步骤 三.安装模块 关闭阿里系ssl验证 开启http模式 ...
- 淘宝(tmall)抓取店铺订单解密数据、打印电子面单、订单推送保存到erp软件中
前言 最近有厂商提出想把淘宝(tmall)店铺的卖出的订单详情数据采集到后台ERP管理系统中,并能实现线下打印电子面单功能.接手这个需求按照度娘给的指引,申请淘宝(tmall)开发者帐号,但是...开 ...
- 项目进展:淘宝店铺抓取
1.概要: 项目为了抓取淘宝中可能存在的侵犯明星肖像权的行为,目标获取店铺首页的图片 淘宝店铺首页:https://shopsearch.taobao.com/search?app=shopsearc ...
- Python自动登陆淘宝并爬取商品数据
前言 本文的文字及图片来源于网络,仅供学习.交流使用,不具有任何商业用途,如有问题请及时联系我们以作处理. 基本开发环境 Python 3.6 Pycharm import time from sel ...
- Scrapy框架学习 - 爬取豆瓣电影排行榜TOP250所有电影信息并保存到MongoDB数据库中
概述 利用Scrapy爬取豆瓣电影Top250排行榜电影信息,并保存到MongoDB数据库中 使用pymongo库操作MOngodb数据库 没有进行数据清洗 源码 items.py class Dou ...
- 淘宝/天猫seller_order_list-获取卖出的商品订单列表接口接入解决方案
一.淘宝/天猫seller_order_list-获取卖出的商品订单列表接口API 返回值说明 点击注册获取key和secret测试账号 提取淘宝天猫店铺卖家账号买到的订单编号,订单金额,订单详情等, ...
- Python爬虫实战(5):模拟登录淘宝并获取所有订单
Python爬虫入门(1):综述 Python爬虫入门(2):爬虫基础了解 Python爬虫入门(3):Urllib库的基本使用 Python爬虫入门(4):Urllib库的高级用法 Python爬虫 ...
最新文章
- 【数据库】sqlite3常用命令及SQL语句
- HTML POST提交参数给PHP并返回json,上传execl文件
- 看我如何拿下公司OA服务器
- 源路由 小实验 小发现
- 浙大三维视觉团队提出Animatable NeRF,从RGB视频中重建可驱动人体模型 (ICCV'21)
- 从零开始学python | 使用Python映射,过滤和缩减函数:所有您需要知道的
- 吴恩达深度学习2.1练习_Improving Deep Neural Networks(Initialization_Regularization_Gradientchecking)
- 深入理解JAVA虚拟机大全
- 真香警告!java时间格式转换工具
- Deep Retinex Decomposition for Low-LightEnhancement (2018 BMCV,含代码)
- js自定义函数传参(字符串)问题
- 【学习感悟】找工作之前的焦虑
- MAC系统中快速切换输入法的方法
- 记一次hydra密码破解神器的学习
- 检测到u盘但是计算机没有反应,u盘插上电脑没反应,教您修复无法识别u盘问题...
- Wormhole漏洞分析
- 国防科大计算机学院贾焰,国防科大教师中院士顶级选手
- 透析SpringBoot jar可执行原理
- 如何实现国外域名调转到国内已备案ip
- 【Unity学习笔记】标签(Tag)和层(Layer)
热门文章
- swagger中paramType请求类型为body
- 麦肯锡精英的39个工作习惯
- python 限定数据范围_Python 生成周期性波动的数据 可指定数值范围2
- oracle语句中dual什么意思,oracle中dual详解
- linux学习笔记三: secureCRT小键盘输入数字键的时候,出现字母的解决方法:
- dns的基本设定(一)
- db2 修改表空间自增长_db2自动调整表空间的大小 - 木子日京的个人空间 - 51Testing软件测试网 51Testing软件测试网-软件测试人的精神家园...
- [十月往昔]——Linux内核中的list.h浅谈
- 华为云Stack在政务云市场,稳!
- 大数据应用分析解决方案----图书出版