题目描述

我计划写一个小工具,爬取我账号里面的数据,采用requests登陆后,虽然可以正常登陆,但是无法下载里面Excel数据,麻烦大货帮我分析一下,怎么解决。我知道可能是权限问题,下载的时候需要带cookies,虽然我又附加,但是显示无此页面。

相关代码

coding=utf-8

import requests

import itchat

import xlrd

import time

from requests.cookies import RequestsCookieJar

def user_login():

username = raw_input("请输入您的工号:")

password = raw_input("请输入您的密码:")

login_data = {

'action': "login",

'account': username,

'password': password,

}

base_url = "https://kdy.kuaidihelp.com/account/Ajax"

headers = {'Accept': 'text/html, application/xhtml+xml, image/jxr, */*',

'Accept - Encoding': 'gzip, deflate',

'Accept-Language': 'zh-Hans-CN, zh-Hans; q=0.5',

'Connection': 'Keep-Alive',

'Host': 'www.kuaidihelp.com',

'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/52.0.2743.116 Safari/537.36 Edge/15.15063'}

html = requests.post(base_url, data=login_data, headers= headers) #先登录取得cookies

login_cookies = requests.cookies.RequestsCookieJar() # 利用RequestsCookieJar获取

login_cookies.set('onlinewduser', 'QC8%2FgJRSBVCaubrSfGDJDQZx3IleevuBpIOLQ1VdUJC37askB715oECn44HpiNG6UQUOl0WnQXIjvWHmsyMjvCEnQjsUqLB1Ojxm8hAuOgGK3l4W%2F8eJgP%2F3ExoTbNVT0OmugzsCjjNM %2Bq4omPohvQIiEbcmz7daEiPhT%2FBmX%2FmZPwLknxke%2FAadewMYctrOzyvxon6srfL2PbnA9HOI1nTmtDmiTL8shl8uLH8bxCTl0McD6OsTd5JZKQp6xoT39KqOanEnoeSMznmfHVs04gr%2FpCWK78XGSmJXciVm07FcgOZGasKC1n9gy1r%2FcYvo')

from_time = time.strftime('%Y-%m-%d',time.localtime(time.time()))

print from_time

excel_url = "https://kdy.kuaidihelp.com/ess/downPrintRecord?s_date={}&e_date={}&type=backupRecord&d_l=1".format(from_time, from_time)

print excel_url

r = requests.get(excel_url, stream=False, headers=headers, cookies=login_cookies,)

print r.text

with open("data.txt", "wb") as code:

code.write(r.content)

time.sleep(500)

user_login()

你期待的结果是什么?实际看到的错误信息又是什么?

我想登陆我的工号,下载每天的发货记录,然后通过微信通知我检查一下,避免有漏扫描的。

问题出现的环境背景及自己尝试过哪些方法

一开始可以登陆正常,requests返回码显示200.但是后来提交下载的URL后,显示页面不存在。我查看过cookies后发现,登陆以后cookies会多一项,于是我更新cookies中新增的值,还是报一样的错。

你期待的结果是什么?实际看到的错误信息又是什么?

依照我的规划,我登陆可以直接下载到所有数据,然后将数据清洗一下,然后通过itchat发送到我的微信。

python登录网站下载excel_写了一个小工具,爬去指定网站的的登陆后的数据进行整理,可以正常登陆了,但是无法下载excel文件?...相关推荐

  1. aspose 转pdf表格大小乱了_自己写了一个小工具类:pdf转word,没有页数和大小限制,保真!...

    昨天下午遇到一个问题,想把一个比较大的pdf转化为word,结果使用了各种工具都收费.想着干脆写一个小工具吧,一开始使用的python等等试了好几个网上的代码,结果全都失真.于是乎不得不花了一下午自己 ...

  2. python代码怎么变成软件_从Python代码到APP,你只需要一个小工具:GitHub已超6000星

    点击上方Python知识圈,选择设为星标 回复1024获取Python资料 选自TowardsDataScience作者:Adrien Treuille机器之心编译参与:魔王.一鸣 阅读文本大概需要 ...

  3. 之前帮朋友写的一个小工具-征途2新浪卡全自动淘号工具+按钮精灵脚本

    比较简单的小工具 using System; using System.Collections.Generic; using System.ComponentModel; using System.D ...

  4. 【开源一个小工具】一键将网页内容推送到Kindle

    http://www.zijinxing.com/201412/124636.html 最近工作上稍微闲点,这一周利用下班时间写了一个小工具,其实功能挺简单但也小折腾了会. 工具名称:Simple S ...

  5. 【python小项目】用python写一个小工具——番茄钟

    用python写一个小工具--番茄钟 最近听到朋友说在用番茄钟,有点兴趣也想下载一个来用用,后面仔细一想这玩意做起来也不难,索性自己顺手写一个算了,在这里也分享给大家了 一.功能简述 番茄钟即番茄工作 ...

  6. Python3 + wxpython写的一个翻译工具

    Python3 + wxpython写的一个翻译工具 学习日语一直有一个问题,有些时候我们看到一句话,可能大致上能猜出来是什么意思,但是日语汉字却不知道怎么去读.我就有这样的烦恼,极大的降低了我对日语 ...

  7. 用Python写了个小工具,再复杂的文件夹,分分钟帮你整理!

    糟透了 我承认我不是一个爱整理桌面的人,因为我觉得乱糟糟的桌面,反而容易找到文件. 哈哈,可是最近桌面实在是太乱了,自己都看不下去了,几乎占满了整个屏幕.虽然一键整理桌面的软件很多,但是对于其他路径下 ...

  8. b站在线解析_一个小工具,教你如何轻松下载B站上喜欢的视频!

    朋友们,大家好! B站一直是我最喜欢的视频平台,没有之一!但是呢,看到喜欢的视频,只能收藏下来,万一哪天被删了就看不到啦,所以有什么好的办法保存到本地呢?今天就给大家分享一款下载B站视频的小工具呀,各 ...

  9. 西门子行贿门情报列表,我自己写的一个小软件自动搜集到的。

    西门子行贿门消息列表 我自己写的一个小软件自动搜集到的. 其他类型情报也能自动收集. · 编号:1    西门子在华行贿案或涉及权力部门_中华财经    http://invest.8bio.com/ ...

最新文章

  1. ORB_SLAM2概述
  2. Firewall防火墙应用案例
  3. set_union()和set_intersection()的用法
  4. html5抬头,HTML !DOCTYPE 标签
  5. springboot使用原生servlet、filter、listener
  6. 官博翻译 | .NET Core 即 .NET 的未来
  7. 默写标准答案0917
  8. 计算机工程师英语介绍,数据库系统工程师计算机专业英语(四).doc
  9. 一文讲懂什么是vlan、三层交换机、网关、DNS、子网掩码、MAC地址
  10. 学习《华为基本法》(7):利益分配
  11. 给信号添加指定信噪比的带限白噪声
  12. uploadify上传文件在360浏览器急速模式下失败
  13. 微信支付--付款到零钱(java后端)
  14. 网络类型NAT3改NAT1 基于(联通)光猫桥接、路由器红米AX5、win10系统
  15. 四年级关于计算机的知识,小学四年级下册信息技术教案
  16. python math库 sqrt eval_假设 math 标准库已导入,那么表达式 eval('math.sqrt(4)') 的值为 _________ 。( ) (2.0分)_学小易找答案...
  17. 2020-助你直通大厂前端中高级面试题
  18. php redis hset过期时间,详解Redis中数据过期策略
  19. Jsoup 爬取真气网排名信息
  20. 《嵌入式linux内存使用与性能优化》读书笔记

热门文章

  1. python一定要有主函数_Python主函数从不调用其他函数?
  2. JAVA —— Git
  3. 操作记录表怎么设计_驻马店钢结构楼梯设计公司
  4. 循环神经网络,注意力机制小结
  5. AMBA总线理解-AXI总线
  6. 初识Java——配置环境变量
  7. c语言文件构建步骤,C语言文件的创建与建立
  8. 用CSS画圆和三角形
  9. html span标签详解
  10. Velodyne VLP-16 激光雷达的使用