python文件下载不全_python requests 下载大文件不完整
目前我有一个脚本, 从帝联的 CDN 外链获取一下文件作为备份.
使用的是
Python 2.7.10
requests 2.8.1
目前碰到一个情况, 使用 requests 下载大文件的时候会出现下载文件不完整的情况, 出现的概率非常大, 应该不会是网络原因导致的. 相关代码概括如下:
requests.adapters.DEFAULT_RETRIES = 5
response = requests.get(url, stream=True)
status = response.status_code
if status == 200:
total_size = int(response.headers['Content-Length'])
with open('xxx', 'wb') as of:
for chunk in response.iter_content(chunk_size=102400):
if chunk:
of.write(chunk)
下载完毕后我会使用如下方式和上面的 total_size 进行对比
with open('xxx', 'r') as f:
if isinstance(f, file):
length = os.fstat(f.fileno()).st_size
if total_size == length:
True
else:
False
代码逻辑如上. 但是对于 100M 以上的文件, 几乎都是保存在本地的文件和获取的响应头里面的 content-length 不一致.
是我 requests 的用法不对吗? 还是有其他更好的办法可以保证文件能完整的下载呢?
python文件下载不全_python requests 下载大文件不完整相关推荐
- python requests下载文件很慢-python requests 下载大文件不完整
目前我有一个脚本, 从帝联的 CDN 外链获取一下文件作为备份. 使用的是 Python 2.7.10 requests 2.8.1 目前碰到一个情况, 使用 requests 下载大文件的时候会出现 ...
- python下载大文件-python requests 下载大文件不完整
目前我有一个脚本, 从帝联的 CDN 外链获取一下文件作为备份. 使用的是 Python 2.7.10 requests 2.8.1 目前碰到一个情况, 使用 requests 下载大文件的时候会出现 ...
- requests下载大文件_11种方法教你用Python高效下载资源!
在本教程中,你将学习如何使用不同的Python模块从web下载文件.此外,你将下载常规文件.web页面.Amazon S3和其他资源. 最后,你将学习如何克服可能遇到的各种挑战,例如下载重定向的文件. ...
- Apache站点下载大文件不完整原因及解决办法(128M自动中断)
学习网址:www.only-softs.com 问题: 使用浏览器(如IE等)直接下载大于1G的大文件,浏览器下载至128M自动中断. 解决方法: 只要把Apache的配置文件httpd.conf里& ...
- python 下载大文件
python 下载大文件 文件过大,建议用迅雷 下载大文件 import os import time import requests# 下载大文件 def download_data(url, pa ...
- python断点续传下载_Python 3 爬虫|第12章:并发下载大文件 支持断点续传
1. stream 流式下载大文件 1.1 stream=True 和 iter_content() 我们将继续使用 Python 3 爬虫|第3章:同步阻塞下载 所搭建的测试环境,在 Nginx 默 ...
- Python requests下载超大文件/批量下载文件
(一)下载超大文件: 使用 python 下载超大文件,直接全部下载,文件过大,可能会造成内存不足,这时候要使用 requests 的 stream 模式 主要代码如下 iter_content:一块 ...
- python下载大文件-使用请求在python中下载大文件
请求是一个非常好的库.我想用它下载大文件(>1GB).问题是不可能将整个文件保存在内存中,我需要将其分块读取.以下代码有问题 1 2 3 4 5 6 7 8 9 10 11import requ ...
- 使用请求在python中下载大文件
本文翻译自:Download large file in python with requests Requests is a really nice library. 请求是一个非常不错的库. I' ...
最新文章
- 如何禁止页面被 jframe 引用_PD1该如何使用?靶向能否转用PD1?
- 基于 HTML5 Canvas 的交互式地铁线路图
- SQL SERVER 存储过程执行带输出参数的SQL语句拼接
- Jython安装配置教程(2.7.2)
- MappingException:class com.zsn.crm.Model.user not found whie looking for property user id
- 解决RecyclerView的onClickListener问题
- 从Unix开源开发学习应对大型复杂项目开发
- SQL Server 2005 Service Pack 4 下载地址
- 阿江ASP探针 V 1.92
- 北大飞跃手册_飞跃手册 | 保研篇——北京大学
- 深度学习、机器学习面试问题总结
- 省市县乡四级联动java代码,jQuery省市区街道四级联动代码
- ae制h5文字动画_绝对干货!H5动画制作方法全揭秘!
- 【Axure原型分享】冻结首行首列的中继器表格
- Ubuntu下mysql的配置
- 大数据小项目之电视收视率企业项目12
- 【程序员段子】10个让你笑爆肚皮的程序员段子,不好笑算我输(生活太苦,不如经常来点儿甜~)
- 测试硬盘软件hd不能结束进程,终于解决了HD TUNE以及所有其他硬盘检测工具都不能使用的情况。。...
- 完全解读 OpenPyXL 设置 Excel 单元格样式
- 什么是函数?什么是无参函数?什么是返回值?函数的分类?
热门文章
- MATLAB当中线性方程组、不定方程组、奇异方程组、超定方程组的介绍
- happens-before规则
- LAMP架构 (资源)
- 解决IDEA启动报错---找不到配置项
- Ubuntu kylin优麒麟root用户与静态网络设置
- 企业家故事|“中国最帅的CEO”套现离场,曾获马云百亿投资(上)
- MachineLearning 13. 机器学习之降维方法UMAP及可视化 (umap)
- 谷歌安装ElasticSearch-head插件
- 简单Excel微型数据库
- 行业揭秘——桥梁主动防撞智能预警系统的干货分享及清单和报价(原创)