网页链接版数据集批量下载

今天下载数据集的时候遇到下载没有打包的情况,需要点每个链接进行下载,很麻烦。其可以用python处理

method

首先 ,将网页保存,保存类型为:网页,全部,得到 一个HTML 文件

然后,用notepad++打开这个HTML 文件,

点击“搜索”——>查找,输入href,选中在当前文件中查找。这里注意根据所要下载的链接,灵活变换

得到搜索结果,将搜索结果全部选中,复制到TXT文件中

点击编辑——>替换,将引号替换为空格,全部替换

接着,用python读取TXT文件,提取出下载链接 )写入新的TXT中。代码为:

#!/usr/bin/env python
# -*- coding:utf-8 -*-
f = open('en.txt', 'r')  # 文件为123.txt
sourceInLines = f.readlines()  # 按行读出文件内容
f.close()
new = []  # 定义一个空列表,用来存储结果for line in sourceInLines:a = line.split(" ")print(a[13])

此时得到所有的下载链接:

最后,将提取出来的下载链接复制到迅雷中批量下载。注意一定要用最新版迅雷。

批量下载网页链接---数据集批量下载相关推荐

  1. 下载网页所有图片-免费一键下载网页所有图片

    下载网页所有图片,今天给大家分享一款免费图片批量下载软件,支持任意格式的图片批量下载,只需要输入关键词或批量导入网页链接即可批量下载图片.每个人都可以拥有各种高清图源.支持批量图片压缩/放大/添加水印 ...

  2. 下载网页图片-如何批量下载网页图片-批量图片下载工具免费

    下载网页图片,今天给大家分享一款免费批量下载网页图片软件,支持任意格式的图片批量下载,只需要输入关键词或批量导入网页链接即可下载图片.批量下载任意网页上的图片,每个人都可以拥有各种高清图源.支持批量图 ...

  3. 一键下载网页所有图片-免费批量网页图片下载软件

    一键下载网页所有图片,今天给大家分享一款免费批量下载网页上的图片软件,支持任意格式的图片批量下载,只需要输入关键词或批量导入网页链接即可下载图片.批量下载任意网页上的图片,每个人都可以拥有各种高清图源 ...

  4. 批量采集html软件,在线批量获取网页链接工具 浏览器插件版-♚付涛纪实阁♚

    这两天在弄网站蜜蜂采集的时候,发现原来收藏的一个[在线批量获取网页链接工具]工具对应的网站已经不知道什么原因打不开了:在百度里面通过这个词去一搜索,一初搜索,看到百度结果里面拥有大量的匹配信息,但是经 ...

  5. php 批量插件下载,网页链接批量复制插件下载 Bulk URL Opener (网页链接批量复制插件) v1.11.1 免费版 下载-脚本之家...

    Bulk URL Opener是一款简单好用的网页链接批量复制插件,该工具支持批量复制URL.批量打开等功能,极大提升了用户对于大量网址的处理效率,在短时间内完成多链接的操作,需要的人群千万别错过.感 ...

  6. 下载网页视频的软件 下载网页视频的方法

    视频已然成为一种非常有力的展示方式,我们想要下载视频内容,需要用到下载网页视频的软件,如今这类软件有很多.下载网页视频的方法,也因为使用的软件不同,方法各异.下面我们就来看详细介绍吧! 一.下载网页视 ...

  7. python批量下载网页文件-Python批量下载网页图片详细教程

    目标:爬取某个网站上n多页的链接,每个链接有n多张图片,每一页对应一个文件夹,每个文件夹包含n个链接所对应的文件夹. 步骤1:获得网页的所有链接,访问所有链接,获得链接里的图片地址. 步骤2:根据图片 ...

  8. python批量下载网页图片_python批量下载网站马拉松照片的完整步骤

    前言 目前学习python几个月了,由于自己比较喜欢跑马拉松,已经跑过了很多场比赛,前些天就写了个简单的爬虫爬取了网上三千多场马拉松比赛的报名信息. 今年5月27日,我又参加了巴图鲁关门山壹佰越野50 ...

  9. python 批量下载网页图片_Python批量爬取图片并下载

    PS:本文附赠爬汇图网图片的方法 本文的目录看这里:前言找资源部分进入编程猫图鉴网找到聚集地获取聚集地网址代码部分导入相应的库re库介绍代码获取整个网站的内容扩展:状态码的意思其他的代码--总体代码关 ...

  10. ibm软件下载网页链接

    为了快速了解websphere,可到这儿进行相关软件下载与学习 http://www14.software.ibm.com/webapp/download/home.jsp 来自 " ITP ...

最新文章

  1. java python算法_用Python,Java和C ++示例解释的排序算法
  2. 人群计数最全代码、数据、论文合集
  3. MTK modem 通话无声
  4. 没有该栏目数据 可能缓存文件(data/cache/inc_catalog_base.inc)没有更新请检查是否有写入权限...
  5. Unity游戏接入TypeSDK集成笔记
  6. idea中如何查看一个类的方法被那些类调用了,显示方法对应的调用树
  7. 【毕设】知网文献检索列表中的 href 解析为可访问的 URL
  8. 安装此计算机程序代码18,我安装VS15,运行程序代码的时候显示的是计算机丢失msv...
  9. LiveZilla 详细 配置 设置 (一) 安装 wamp
  10. julia语言 python解释器_Julia官宣:为机器学习构建一种语言和编译器
  11. 留言板(php+数据库)
  12. php++ui设计课程,UI设计主要学什么?
  13. PHP初级【10天小积累-第二天】
  14. 实际工作中遇到的技术难题与大家交流(工作流条件表达式计算部分),希望技术高手能给于指点
  15. 打工随思录---过客
  16. PHP入门难吗?怎么自学?
  17. 一张图数字孪生北京大兴机场
  18. HTTP http/https 1.0、1.1、2.0 get/post 以及幂等性 http 协议头相
  19. 20160510 GreenPlum4 SQL中求和相关语句的总结
  20. 启动hiveserver2连接不上jdbc:hive2://localhost:10000

热门文章

  1. 固态硬盘是什么接口_小白指南:固态硬盘接口傻傻分不清,新手用户应该如何选?...
  2. PDF编辑方法,怎么给PDF添加页码
  3. 【已解决】The server cannot or will not process the request due to something that is perceived to be ...
  4. 如何简单有效的管理企业数据安全
  5. 服务器重启后samba启动不了,提示stop: Unknown instance: smbd start/running, process 76585
  6. chrome扩展程序_如何实施Chrome扩展程序
  7. IBM新型Tivoli产品搭建绿色销售渠道
  8. C语言URL解析器(代码分享)
  9. mysql左联和全等_Mysql7种join连接及mysql一些知识点-Go语言中文社区
  10. C语言解决找零钱问题