python登录网站下载excel_写了一个小工具,爬去指定网站的的登陆后的数据进行整理,可以正常登陆了,但是无法下载excel文件?...
题目描述
我计划写一个小工具,爬取我账号里面的数据,采用requests登陆后,虽然可以正常登陆,但是无法下载里面Excel数据,麻烦大货帮我分析一下,怎么解决。我知道可能是权限问题,下载的时候需要带cookies,虽然我又附加,但是显示无此页面。
相关代码
coding=utf-8
import requests
import itchat
import xlrd
import time
from requests.cookies import RequestsCookieJar
def user_login():
username = raw_input("请输入您的工号:")
password = raw_input("请输入您的密码:")
login_data = {
'action': "login",
'account': username,
'password': password,
}
base_url = "https://kdy.kuaidihelp.com/account/Ajax"
headers = {'Accept': 'text/html, application/xhtml+xml, image/jxr, */*',
'Accept - Encoding': 'gzip, deflate',
'Accept-Language': 'zh-Hans-CN, zh-Hans; q=0.5',
'Connection': 'Keep-Alive',
'Host': 'www.kuaidihelp.com',
'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/52.0.2743.116 Safari/537.36 Edge/15.15063'}
html = requests.post(base_url, data=login_data, headers= headers) #先登录取得cookies
login_cookies = requests.cookies.RequestsCookieJar() # 利用RequestsCookieJar获取
login_cookies.set('onlinewduser', 'QC8%2FgJRSBVCaubrSfGDJDQZx3IleevuBpIOLQ1VdUJC37askB715oECn44HpiNG6UQUOl0WnQXIjvWHmsyMjvCEnQjsUqLB1Ojxm8hAuOgGK3l4W%2F8eJgP%2F3ExoTbNVT0OmugzsCjjNM %2Bq4omPohvQIiEbcmz7daEiPhT%2FBmX%2FmZPwLknxke%2FAadewMYctrOzyvxon6srfL2PbnA9HOI1nTmtDmiTL8shl8uLH8bxCTl0McD6OsTd5JZKQp6xoT39KqOanEnoeSMznmfHVs04gr%2FpCWK78XGSmJXciVm07FcgOZGasKC1n9gy1r%2FcYvo')
from_time = time.strftime('%Y-%m-%d',time.localtime(time.time()))
print from_time
excel_url = "https://kdy.kuaidihelp.com/ess/downPrintRecord?s_date={}&e_date={}&type=backupRecord&d_l=1".format(from_time, from_time)
print excel_url
r = requests.get(excel_url, stream=False, headers=headers, cookies=login_cookies,)
print r.text
with open("data.txt", "wb") as code:
code.write(r.content)
time.sleep(500)
user_login()
你期待的结果是什么?实际看到的错误信息又是什么?
我想登陆我的工号,下载每天的发货记录,然后通过微信通知我检查一下,避免有漏扫描的。
问题出现的环境背景及自己尝试过哪些方法
一开始可以登陆正常,requests返回码显示200.但是后来提交下载的URL后,显示页面不存在。我查看过cookies后发现,登陆以后cookies会多一项,于是我更新cookies中新增的值,还是报一样的错。
你期待的结果是什么?实际看到的错误信息又是什么?
依照我的规划,我登陆可以直接下载到所有数据,然后将数据清洗一下,然后通过itchat发送到我的微信。
python登录网站下载excel_写了一个小工具,爬去指定网站的的登陆后的数据进行整理,可以正常登陆了,但是无法下载excel文件?...相关推荐
- aspose 转pdf表格大小乱了_自己写了一个小工具类:pdf转word,没有页数和大小限制,保真!...
昨天下午遇到一个问题,想把一个比较大的pdf转化为word,结果使用了各种工具都收费.想着干脆写一个小工具吧,一开始使用的python等等试了好几个网上的代码,结果全都失真.于是乎不得不花了一下午自己 ...
- python代码怎么变成软件_从Python代码到APP,你只需要一个小工具:GitHub已超6000星
点击上方Python知识圈,选择设为星标 回复1024获取Python资料 选自TowardsDataScience作者:Adrien Treuille机器之心编译参与:魔王.一鸣 阅读文本大概需要 ...
- 之前帮朋友写的一个小工具-征途2新浪卡全自动淘号工具+按钮精灵脚本
比较简单的小工具 using System; using System.Collections.Generic; using System.ComponentModel; using System.D ...
- 【开源一个小工具】一键将网页内容推送到Kindle
http://www.zijinxing.com/201412/124636.html 最近工作上稍微闲点,这一周利用下班时间写了一个小工具,其实功能挺简单但也小折腾了会. 工具名称:Simple S ...
- 【python小项目】用python写一个小工具——番茄钟
用python写一个小工具--番茄钟 最近听到朋友说在用番茄钟,有点兴趣也想下载一个来用用,后面仔细一想这玩意做起来也不难,索性自己顺手写一个算了,在这里也分享给大家了 一.功能简述 番茄钟即番茄工作 ...
- Python3 + wxpython写的一个翻译工具
Python3 + wxpython写的一个翻译工具 学习日语一直有一个问题,有些时候我们看到一句话,可能大致上能猜出来是什么意思,但是日语汉字却不知道怎么去读.我就有这样的烦恼,极大的降低了我对日语 ...
- 用Python写了个小工具,再复杂的文件夹,分分钟帮你整理!
糟透了 我承认我不是一个爱整理桌面的人,因为我觉得乱糟糟的桌面,反而容易找到文件. 哈哈,可是最近桌面实在是太乱了,自己都看不下去了,几乎占满了整个屏幕.虽然一键整理桌面的软件很多,但是对于其他路径下 ...
- b站在线解析_一个小工具,教你如何轻松下载B站上喜欢的视频!
朋友们,大家好! B站一直是我最喜欢的视频平台,没有之一!但是呢,看到喜欢的视频,只能收藏下来,万一哪天被删了就看不到啦,所以有什么好的办法保存到本地呢?今天就给大家分享一款下载B站视频的小工具呀,各 ...
- 西门子行贿门情报列表,我自己写的一个小软件自动搜集到的。
西门子行贿门消息列表 我自己写的一个小软件自动搜集到的. 其他类型情报也能自动收集. · 编号:1 西门子在华行贿案或涉及权力部门_中华财经 http://invest.8bio.com/ ...
最新文章
- ORB_SLAM2概述
- Firewall防火墙应用案例
- set_union()和set_intersection()的用法
- html5抬头,HTML !DOCTYPE 标签
- springboot使用原生servlet、filter、listener
- 官博翻译 | .NET Core 即 .NET 的未来
- 默写标准答案0917
- 计算机工程师英语介绍,数据库系统工程师计算机专业英语(四).doc
- 一文讲懂什么是vlan、三层交换机、网关、DNS、子网掩码、MAC地址
- 学习《华为基本法》(7):利益分配
- 给信号添加指定信噪比的带限白噪声
- uploadify上传文件在360浏览器急速模式下失败
- 微信支付--付款到零钱(java后端)
- 网络类型NAT3改NAT1 基于(联通)光猫桥接、路由器红米AX5、win10系统
- 四年级关于计算机的知识,小学四年级下册信息技术教案
- python math库 sqrt eval_假设 math 标准库已导入,那么表达式 eval('math.sqrt(4)') 的值为 _________ 。( ) (2.0分)_学小易找答案...
- 2020-助你直通大厂前端中高级面试题
- php redis hset过期时间,详解Redis中数据过期策略
- Jsoup 爬取真气网排名信息
- 《嵌入式linux内存使用与性能优化》读书笔记