在 JavaScript 中如何实现并发控制? 这篇文章中,阿宝哥详细分析了 async-pool 这个库如何利用 Promise.all 和 Promise.race 函数实现异步任务的并发控制。本文阿宝哥将介绍如何利用 async-pool 这个库提供的 asyncPool 函数来实现大文件的并行下载。

相信有些小伙伴已经了解大文件上传的解决方案,在上传大文件时,为了提高上传的效率,我们一般会使用 Blob.slice 方法对大文件按照指定的大小进行切割,然后在开启多线程进行分块上传,等所有分块都成功上传后,再通知服务端进行分块合并。

那么对于大文件下载来说,我们能否采用类似的思想呢?在服务端支持 Range 请求首部的条件下,我们也是可以实现多线程分块下载的功能,具体如下图所示:

看完上图相信你对大文件下载的方案,已经有了一定的了解。接下来,我们先来介绍 HTTP 范围请求。

一、HTTP 范围请求

HTTP 协议范围请求允许服务器只发送 HTTP 消息的一部分到客户端。范围请求在传送大的媒体文件,或者与文件下载的断点续传功能搭配使用时非常有用。如果在响应中存在 Accept-Ranges 首部(并且它的值不为 “none”),那么表示该服务器支持范围请求。

在一个 Range 首部中,可以一次性请求多个部分,服务器会以 multipart 文件的形式将其返回。如果服务器返回的是范围响应,需要使用 206 Partial Content 状态码。假如所请求的范围不合法,那么服务器会返回  416 Range Not Satisfiable 状态码,表示客户端错误。服务器允许忽略  Range  首部,从而返回整个文件,状态码用 200 。

1.1 Range 语法

Range: <unit>=<range-start>-
Range: <unit>=<range-start>-<range-end>
Range: <unit>=<range-start>-<range-end>, <range-start>-<range-end>
Range: <unit>=<range-start>-<range-end>, <range-start>-<range-end>, <range-start>-<range-end>
  • unit:范围请求所采用的单位,通常是字节(bytes)。

  • <range-start>:一个整数,表示在特定单位下,范围的起始值。

  • <range-end>:一个整数,表示在特定单位下,范围的结束值。这个值是可选的,如果不存在,表示此范围一直延伸到文档结束。

了解完 Range 语法之后,我们来看一下实际的使用示例:

1.1.1 单一范围
$ curl http://i.imgur.com/z4d4kWk.jpg -i -H "Range: bytes=0-1023"
1.1.2 多重范围
$ curl http://www.example.com -i -H "Range: bytes=0-50, 100-150"

好了,HTTP 范围请求的相关知识就先介绍到这里,下面我们步入正题开始介绍如何实现大文件下载。

二、如何实现大文件下载

为了让大家能够更好地理解后面的内容,我们先来看一下整体的流程图:

了解完大文件下载的流程之后,我们先来定义上述流程中涉及的一些辅助函数。

2.1 定义辅助函数

2.1.1 定义 getContentLength 函数

顾名思义 getContentLength 函数,用于获取文件的长度。在该函数中,我们通过发送 HEAD 请求,然后从响应头中读取 Content-Length 的信息,进而获取当前 url 对应文件的内容长度。

function getContentLength(url) {return new Promise((resolve, reject) => {let xhr = new XMLHttpRequest();xhr.open("HEAD", url);xhr.send();xhr.onload = function () {resolve(~~xhr.getResponseHeader("Content-Length") );};xhr.onerror = reject;});
}
2.1.2 定义 asyncPool 函数

在 JavaScript 中如何实现并发控制? 这篇文章中,我们介绍了 asyncPool 函数,它用于实现异步任务的并发控制。该函数接收 3 个参数:

  • poolLimit(数字类型):表示限制的并发数;

  • array(数组类型):表示任务数组;

  • iteratorFn(函数类型):表示迭代函数,用于实现对每个任务项进行处理,该函数会返回一个 Promise 对象或异步函数。

async function asyncPool(poolLimit, array, iteratorFn) {const ret = []; // 存储所有的异步任务const executing = []; // 存储正在执行的异步任务for (const item of array) {// 调用iteratorFn函数创建异步任务const p = Promise.resolve().then(() => iteratorFn(item, array));ret.push(p); // 保存新的异步任务// 当poolLimit值小于或等于总任务个数时,进行并发控制if (poolLimit <= array.length) {// 当任务完成后,从正在执行的任务数组中移除已完成的任务const e = p.then(() => executing.splice(executing.indexOf(e), 1));executing.push(e); // 保存正在执行的异步任务if (executing.length >= poolLimit) {await Promise.race(executing); // 等待较快的任务执行完成}}}return Promise.all(ret);
}
2.1.3 定义 getBinaryContent 函数

getBinaryContent 函数用于根据传入的参数发起范围请求,从而下载指定范围内的文件数据块:

function getBinaryContent(url, start, end, i) {return new Promise((resolve, reject) => {try {let xhr = new XMLHttpRequest();xhr.open("GET", url, true);xhr.setRequestHeader("range", `bytes=${start}-${end}`); // 请求头上设置范围请求信息xhr.responseType = "arraybuffer"; // 设置返回的类型为arraybufferxhr.onload = function () {resolve({index: i, // 文件块的索引buffer: xhr.response, // 范围请求对应的数据});};xhr.send();} catch (err) {reject(new Error(err));}});
}

需要注意的是 ArrayBuffer 对象用来表示通用的、固定长度的原始二进制数据缓冲区。我们不能直接操作 ArrayBuffer 的内容,而是要通过类型数组对象或 DataView 对象来操作,它们会将缓冲区中的数据表示为特定的格式,并通过这些格式来读写缓冲区的内容

2.1.4 定义 concatenate 函数

由于不能直接操作 ArrayBuffer 对象,所以我们需要先把 ArrayBuffer 对象转换为 Uint8Array 对象,然后在执行合并操作。以下定义的 concatenate 函数就是为了合并已下载的文件数据块,具体代码如下所示:

function concatenate(arrays) {if (!arrays.length) return null;let totalLength = arrays.reduce((acc, value) => acc + value.length, 0);let result = new Uint8Array(totalLength);let length = 0;for (let array of arrays) {result.set(array, length);length += array.length;}return result;
}
2.1.5 定义 saveAs 函数

saveAs 函数用于实现客户端文件保存的功能,这里只是一个简单的实现。在实际项目中,你可以考虑直接使用 FileSaver.js 。如果你对  FileSaver.js  的工作原理感兴趣的话,可以阅读 聊一聊 15.5K 的 FileSaver,是如何工作的? 这篇文章。

function saveAs({ name, buffers, mime = "application/octet-stream" }) {const blob = new Blob([buffers], { type: mime });const blobUrl = URL.createObjectURL(blob);const a = document.createElement("a");a.download = name || Math.random();a.href = blobUrl;a.click();URL.revokeObjectURL(blob);
}

在 saveAs 函数中,我们使用了 Blob 和 Object URL。其中 Object URL 是一种伪协议,允许 Blob 和 File 对象用作图像,下载二进制数据链接等的 URL 源。在浏览器中,我们使用 URL.createObjectURL 方法来创建 Object URL,该方法接收一个 Blob 对象,并为其创建一个唯一的 URL,其形式为 blob:<origin>/<uuid>,对应的示例如下:

blob:https://example.org/40a5fb5a-d56d-4a33-b4e2-0acf6a8e5f641

浏览器内部为每个通过 URL.createObjectURL 生成的 URL 存储了一个 URL → Blob 映射。因此,此类 URL 较短,但可以访问 Blob。生成的 URL 仅在当前文档打开的状态下才有效。

好了,Object URL 的相关内容就先介绍到这里,如果你进一步了解 Blob 和 Object URL 的话,可以阅读 你不知道的 Blob 这篇文章。

2.1.6 定义 download 函数

download 函数用于实现下载操作,它支持 3 个参数:

  • url(字符串类型):预下载资源的地址;

  • chunkSize(数字类型):分块的大小,单位为字节;

  • poolLimit(数字类型):表示限制的并发数。

async function download({ url, chunkSize, poolLimit = 1 }) {const contentLength = await getContentLength(url);const chunks = typeof chunkSize === "number" ? Math.ceil(contentLength / chunkSize) : 1;const results = await asyncPool(poolLimit,[...new Array(chunks).keys()],(i) => {let start = i * chunkSize;let end = i + 1 == chunks ? contentLength - 1 : (i + 1) * chunkSize - 1;return getBinaryContent(url, start, end, i);});const sortedBuffers = results.map((item) => new Uint8Array(item.buffer));return concatenate(sortedBuffers);
}

2.2 大文件下载使用示例

基于前面定义的辅助函数,我们就可以轻松地实现大文件并行下载,具体代码如下所示:

function multiThreadedDownload() {const url = document.querySelector("#fileUrl").value;if (!url || !/https?/.test(url)) return;console.log("多线程下载开始: " + +new Date());download({url,chunkSize: 0.1 * 1024 * 1024,poolLimit: 6,}).then((buffers) => {console.log("多线程下载结束: " + +new Date());saveAs({ buffers, name: "我的压缩包", mime: "application/zip" });});
}

由于完整的示例代码内容比较多,阿宝哥就不放具体的代码了。感兴趣的小伙伴,可以访问以下地址浏览示例代码。

完整的示例代码:https://gist.github.com/semlinker/837211c039e6311e1e7629e5ee5f0a42

这里我们来看一下大文件下载示例的运行结果:

三、总结

本文介绍了在 JavaScript 中如何利用 async-pool 这个库提供的 asyncPool 函数,来实现大文件的并行下载。除了介绍 asyncPool 函数之外,阿宝哥还介绍了如何通过 HEAD 请求获取文件大小、如何发起 HTTP 范围请求及在客户端如何保存文件等相关知识。其实利用 asyncPool 函数不仅可以实现大文件的并行下载,而且还可以实现大文件的并行上传,感兴趣的小伙伴可以自行尝试一下。

四、参考资源

  • 你不知道的 Blob

  • MDN - ArrayBuffer

  • MDN - HTTP请求范围

  • JavaScript 中如何实现并发控制?


关于奇舞精选

《奇舞精选》是360公司专业前端团队「奇舞团」运营的前端技术社区。关注公众号后,直接发送链接到后台即可给我们投稿。

奇舞团是360集团最大的大前端团队,代表集团参与W3C和Ecma会员(TC39)工作。奇舞团非常重视人才培养,有工程师、讲师、翻译官、业务接口人、团队Leader等多种发展方向供员工选择,并辅以提供相应的技术力、专业力、通用力、领导力等培训课程。奇舞团以开放和求贤的心态欢迎各种优秀人才关注和加入奇舞团。

JavaScript 中如何实现大文件并行下载?相关推荐

  1. 实现微信小程序web-view内嵌H5中的下载功能(大文件切片下载)

    实现微信小程序内嵌H5中的下载功能 一.项目场景: 难点 解决方案: 1.H5微信小程序: a.首先必不可少的是安装jweixin-module模块: b.在main.js中将依赖绑定: c.H5对应 ...

  2. iOS开发之网络编程--使用NSURLConnection实现大文件断点续传下载

    前言:iOS开发之网络编程--使用NSURLConnection实现大文件断点续传下载是在前篇iOS开发之网络编程--使用NSURLConnection实现大文件下载的基础上进行    断点续传的设置 ...

  3. 使用NSURLConnection实现大文件断点下载

    使用NSURLConnection实现大文件断点下载 由于是实现大文件的断点下载,不是下载一般图片什么的.在设计这个类的时候本身就不会考虑把下载的文件缓存到内存中,而是直接写到文件系统. 要实现断点下 ...

  4. github删除文件_github 仓库中删除历史大文件

    问题 如果git中提交了大文件,而且保存到了版本库中,那在下载或者克隆git包的时候,速度会非常慢.再加上github在国内访问本来就很慢,可能会导致包无法下载(克隆).为了提升下载(克隆)速度,可以 ...

  5. Vue项目中遇到了大文件分片上传的问题

    Vue项目中遇到了大文件分片上传的问题,之前用过webuploader,索性就把Vue2.0与webuploader结合起来使用,封装了一个vue的上传组件,使用起来也比较舒爽. 上传就上传吧,为什么 ...

  6. Java实现大文件多线程下载,提速30倍!想学?我教你啊

    前言 在上一篇文章 <面试官不讲武德>对Java初级程序猿死命摩擦Http协议 中,我们有提到大文件下载和断点续传,本篇我们就来开发一个多线程文件下载器,最后我们用这个多线程下载器来突破云 ...

  7. Javascript中的陷阱大集合【译】

    参考:http://www.2cto.com/kf/201111/111203.html 昨天晚上在自己的个人技术博客上翻译了一篇有关Javascript的文章,今天想想还是把它投稿到博客园吧,大家可 ...

  8. linux如何找大文件夹,Linux系统中如何查找大文件或目录文件夹的方法

    Linux系统中如何查找大文件或文件夹的方法 在Windows系统中,我们可以使用TreeSize工具查找一些大文件或文件夹,非常的方便高效,在Linux系统中,如何去搜索一些比较大的文件呢?下面我整 ...

  9. Linux命令行下载大文件,下载Onedrive文件

    Linux命令行下载大文件,下载Onedrive文件 做深度学习实验时,经常会遇到下载数据集,下载到本地又上传到Linux服务器上,这时用rz上传会很慢,在网上找到一些方法,用curl下载One-dr ...

最新文章

  1. 刚刚,谷歌终于回应AI专利争议:怕被碰瓷,抢先下手,永不牟利
  2. Scanner类的基本总结
  3. 用 CSS 做轮播图
  4. qrcodejs2--Vue生成二维码组件封装
  5. 实验四 图的实现与应用
  6. Sentinel(十)之系统自适应限流
  7. 邱勇校长在2018级研究生开学典礼上的讲话 | 融合成就人生新的高度
  8. volatile关键字的用法
  9. 【华为云技术分享】Batch Normalization (BN) 介绍
  10. 【flink】Flink 使用IntelliJ IDEA 进行远程调试代码
  11. 2021-2025年中国单相静态电能表行业市场供需与战略研究报告
  12. 理解 static 关键字
  13. 数据挖掘肿瘤预测_最新成年人群癌症预测模型:基于中国健康与营养调查(CHNS)数据!...
  14. [Win+RF]新人视角-快速上手RF的接口测试
  15. G-Dezender批量解密
  16. 外贸建站需要注意的事项
  17. 光子晶体的应用背景和研究历史
  18. javascript:void(0)的作用
  19. Echarts y轴高度设置(宽度铺满整个父级高度)
  20. 学生成绩管理系统1.0

热门文章

  1. 薄荷油为什么可以使人感觉凉爽
  2. 称“电池医生”商标被擅用 金山公司诉“豌豆荚”索赔100万元
  3. 搞定迅雷固件在TP-LINK WR720N,127.0.0.1 9000 获取不到激活码
  4. Python flappy bird 小游戏
  5. ps将每层导出为图片序列
  6. 第十章 实验二 统计英文单词
  7. SO_REUSEADDR 套接字,解决(Address already in ues)问题
  8. 以计算机为主题的作文500字,玩电脑作文500字(精选10篇)
  9. java抽奖概率抽奖
  10. 山东标梵来探究APP开发盈利的难点在哪?