使用迅雷下载FSNS数据集
一、什么是FSNS数据集?
FSNS(French Street Name Sign)指的是法国街道名称标志,它包含了大量的法国街道名称标志的图像。该数据集最显著的特征是不包含图像文本定位的标注,可以用来作为端到端的OCR(Optical Character Recognition)算法训练与测试的数据集。
二、怎样使用迅雷下载FSNS数据集?
(1). 安装pywin32,打开Anaconda Prompt、PowerShell或者cmd,输入以下命令:
python -m pip install pypiwin32
(2).具体下载代码如下:
import argparse
import os
import urllib.request#win32com安装方式:python -m pip install pypiwin32
#python为对应环境下的python解释器
from win32com.client import Dispatch#fsns (French Street Name Sign)数据集下载路径
BASE_URL = "http://download.tensorflow.org/data/fsns-20160927/" #数据集标记,test,train,validation分别为测试集,训练集,验证集
#0代表从第0部分开始下载,64,512,64代表每一个数据集包含的总部分数
SETS = [('test', 0, 64), ('train', 0, 512),('validation', 0, 64),
]if __name__ == "__main__":parser = argparse.ArgumentParser(description='tool that downloads fsns dataset')#下载的数据集的相对存放路径parser.add_argument("--destination_dir",default="datasets/fsns_data", help='path to destination directory')args = parser.parse_args()for set_name, start_part, num_parts in SETS:dest_dir = os.path.join(args.destination_dir, set_name)os.makedirs(dest_dir, exist_ok=True)for part in range(start_part, num_parts):file_name = "{set_name}-{part:0>5}-of-{num_parts:0>5}".format(set_name=set_name,part=part,num_parts=num_parts,)#下载路径url = "{base}{set_name}/{file_name}".format(base=BASE_URL,set_name=set_name,file_name=file_name,)#获取当前下载数据的字节长度file_size = int(urllib.request.urlopen(url).info()['Content-Length'])if (not os.path.exists(os.path.join(dest_dir, file_name)) oros.stat(os.path.join(dest_dir, file_name)).st_size != file_size):print("downloading {}".format(file_name))########################################方式一:使用urllib下载 #################################### with urllib.request.urlopen(url) as url_data, open(os.path.join(dest_dir, file_name), 'wb') as f:# file_size = int(url_data.info()['Content-Length'])# downloaded = 0# block_size = 8192# while True:# buffer = url_data.read(block_size)# if not buffer:# break# downloaded += len(buffer)# f.write(buffer)# print("Got: {:>10} of {:>10} bytes".format(downloaded, file_size), end='\r')#########################################方式二:使用迅雷下载 #################################Dispatch为调用迅雷下载代理所需模块thunder = Dispatch('ThunderAgent.Agent64.1') #调用迅雷代理#迅雷代理添加任务#AddTask("下载路径url", "存储文件名file_name", "保存目录", "任务注释", "引用地址", "开始模式", "只从原始地址下载", "从原始地址下载线程数")#保存目录可以直接使用迅雷默认下载路径,一般使用'下载路径url','存储文件名file_name'两个参数即可thunder.AddTask(url, file_name) thunder.CommitTasks() #提交任务print("{}".format(" " * 100), end='\r')else:print('File already found at:{location}, Continuing...'.format(location=os.path.join(dest_dir, file_name)))continue
使用迅雷下载FSNS数据集相关推荐
- imagenet2012数据集 迅雷下载
大家可以去官网下载,但是官网一般需要注册,所以大家可以复制下面的连接到迅雷中,下载Imagenet数据集 http://www.image-net.org/challenges/LSVR ...
- Imagenet 数据集迅雷下载种子
Imagenet 数据集迅雷下载种子 复制使用迅雷打开进行下载 验证集 http://academictorrents.com/download/5d6d0df7ed81efd49ca99ea4737 ...
- 国内下载国外数据集(库)方案整理
在科研过程中常常需要下载国外数据集,但鉴于国内网络环境往往无法访问.本文总结了一些下载方案,所介绍的方案适用于没有梯子,或梯子流量不够的情况. 方案一 可以试试直接用迅雷能否下载,试试百度云盘的离线下 ...
- python爬虫下载cityscapes数据集
目录 cityscapes数据集下载地址 解决的问题 爬虫脚本 数据集下载 获取url 获取Cookies里的PHPSESSID 问题合集 cityscapes数据集下载地址 https://www. ...
- 危机边缘第一季/全集Fringe迅雷下载
本季Fringe Season 2 第二季(2008)看点:一架从汉堡飞往波士顿航班安全着陆,飞机上的机组成员和乘客却全部死亡.这起离奇案件揭开了一连串奇异.危险事件的序幕. 故事将主要讲述年轻的FB ...
- Keras下载的数据集以及预训练模型保存在哪里
Keras下载的数据集在以下目录中: root\\.keras\datasets Keras下载的预训练模型在以下目录中: root\\.keras\models 在win10系统来说,用户主目录是: ...
- python迅雷远程下载页面_【教程】Chrome浏览器添加迅雷下载支持
2019年4月28日更新: 目前官方最新版本的迅雷X已经实现自动安装Chrome扩展,无需手动安装. 请仍在使用老版本迅雷的雷友升级到官方最新版本的迅雷X. 以下内容已经过期 最近一段时间,Googl ...
- Asp.net生成Excel文件并下载(解决使用迅雷下载页面而不是文件的问题)
这里采用的是在服务端先生成Excel文件,然后利用文件地址下载的方法. 先试用Response.WriteFile的方法: FileInfo fi = new FileInfo(excelFile); ...
- 暴君第一季/全集Tyrant迅雷下载
本季第一季 Tyrant Season 1 (2014)看点:虽然李安退出了FX系列剧<暴君>(Tyrant),称不想耽误了剧集的制作,但显然FX对这部剧的重视程度非比寻常,因为他们找来的 ...
最新文章
- Windows单机配置Kafka环境
- cloud一分钟 | 李飞飞离任谷歌云,工作重心将重新转回学术界
- MySql数据类型介绍
- 《Python分布式计算》 第8章 继续学习 (Distributed Computing with Python)
- 嵌入式电路设计(linux soc电路设计)
- html网站 放新闻 文件夹名字 是什么,服务器上传网页文件时应注意哪几点?
- matlab计算轮廓曲率半径,用matlab求出最小曲率半径曲线方程实例
- 启动Xshell报错:由于找不到MSVCR110.dll,无法继续执行代码。重新安装程序可能会解决此问题
- app系统账号绑定微信openid,H5与后台交互
- python网球比赛模拟_【python】羽毛球竞技模拟
- 我眼中的机器学习(二) 解方程 为什么需要用到机器学习算法
- 应聘华为的朋友小心了,应聘华为的悲惨遭遇!
- 海康摄像头检测摄像头是否处于在线状态
- java IO流之一 IO流介绍
- 谭宁计算机组装与维护,计算机组装与维护论文
- 解决mini_httpd_v1.30在使用http post请求出现 socket hang up的问题
- 【基础知识】PID(比例微分积分)控制
- Python笔记_20_魔术方法
- 为别人撑伞(深度好文)
- 【感想】应试教育的死穴