前言

在TLC大前端信息流会上,@TheLarkInn分享了【PPT】the road to webpack 5。今日早读文章由苏宁@QC-L翻译授权分享。

@QC-L,目前就职于苏宁。印记中文成员之一,React 中文官网负责人

正文从这开始~~

继 webpack v5-beta0 发布后,官方又发布了持久化缓存指南。

Opt-in

首先,要注意的是默认情况下不会启用持久化缓存。你可以自行选择启用。

为何如此?webpack 旨在注重构建安全而非性能。我们没有打算默认启用这一功能,主要原因在于此功能虽然有 95% 几率提升性能,但仍有 5% 的几率中断你的应用程序/工作流/构建。

这可能听起来很糟,但相信我它并非如此。只不过需要开发人员进行额外的操作来配置它。

序列化与反序列化功能具有无需配置的开箱即用体验,但开箱即用的部分可能致使缓存失效。

什么是缓存失效?webpack 需要确认 entry 的缓存何时会失效,并在失效时不再将其用于构建。因此,当你应用程序修改文件时,就会发生此情况。

示例:修改 magic.js。webpack 必须让 entry 为 magic.js 的缓存失效。构建将重新处理该文件,即运行 babel,typescript 诸如此类工具,重新解析文件并运行代码生成。webpack 可能还会致使 entry 为 bundle.js 的缓存失效。然后根据原模块重新构建此文件。

为此,webpack 追踪了每个模块的 fileDependencies contextDependencies 以及 missingDependencies,并创建了文件系统快照。此快照会与真实文件系统进行比较,当检测到差异时,将触发对应模块的重新构建。

webpack 给 bundle.js 的缓存 entry 设置了一个 etag,它为所有贡献者的 hash 值。比较这个 etag,只有当它与缓存 entry 匹配时才能使用。

webpack 4 中的内存缓存也依赖上述这些。从开发人员角度来说,这些都能够开箱即用,无需额外配置。但对于 webpack 5 的持久化缓存来说,却充满着挑战。

以下操作均会让 webpack 使 entry 缓存失效:

  • 当 npm 升级 loader 或 plugin 时

  • 当更改配置时

  • 当更改在配置中读取的文件时

  • 当 npm 升级配置中使用的 dependencies 时

  • 当不同命令行参数传递给 build 脚本时

  • 当有自定义构建脚本并进行更改时

这变得非常棘手。开箱即用的情况下,webpack 无法处理所有这些情况。这就是我们为什么选择安全的方式,并将持久化缓存变为可选特性的原因。我们希望读者可以学习如何启用持久化缓存,以为你提供正确的提示。我们希望你知道需要使用哪种配置来处理你自定义的构建脚本。

构建依赖(dependencies),缓存版本(version)和缓存名(name)

为了处理构建过程中的依赖关系,webpack 提供了三个新工具:

构建依赖(Build dependencies)

此为全新的配置项 cache.buildDependencies,它可以指定构建过程中的代码依赖。为了使它更简易,webpack 负责解析并遵循配置值的依赖。

值类型有两种:文件和目录。目录类型必须以斜杠(/)结尾。其他所有内容都解析为文件类型。

对于目录类型来说,会解析其最近的 package.json 中的 dependencies。对于文件类型来说,我们将查看 node.js 模块缓存以寻找其依赖。

示例:构建通常取决于 webpack 本身的 lib 文件夹:你可以这样配置:

cache.buildDependencies: {

defaultWebpack: ["webpack/lib/"]

}

当 webpack/lib 或 webpack 依赖的库(如,watchpack,enhanced-resolved 等)发生任何变化时,其缓存将失效。webpack/lib 已是默认值,默认情况下无需配置。

另一个示例:构建依旧取决于你的配置文件。具体配置如下:

cache.buildDependencies: {

config: [__filename]

}

__filename 变量指向 node.js 中的当前文件。

当配置文件或配置文件中通过 require 依赖的任何内容发生更改时,也会使得持久化缓存失效。当配置文件通过 require() 引用了所有使用过的插件时,它们也会成为构建依赖项。

如果配置文件通过 fs.readFile 读取文件,则将不会成为构建依赖项,因为 webpack 仅遵循 require()。你需要手动将此类文件添加到 buildDependencies 中。

缓存版本(Version)

构建的某些依赖项不能单纯的依靠对文件的引用,如,从数据库读取的值,环境变量或命令行上传递的值。对于这些值,我们给出了新的配置项 cache.version。

cache.version 类型为 string。传递不同的字符串将使持久化缓存失效。

示例:你的配置中可能会读取环境变量中的 GITREV 并将其与 DefinePlugin 一起使用以将其嵌入到 bundle 中。这使得 GITREV 成为你构建的依赖项。具体配置如下:

cache: {

version: `${process.env.GIT_REV}`

}

缓存名(Name)

在某些情况下,依赖关系会在多个不同的值间切换,并且对于每个值更改都会使得持久化缓存失效,这显然是浪费资源的。对于这类值,我们给出了新的配置项 cache.name。

cache.name 类型为 string。传递值将创建一个隔离且独立的持久化缓存。

cache.name 被用于对文件名进行持久化缓存。确保仅传递短小且 fs-safe 的名称。

示例:你的配置可以使用 --env.target mobile|desktop 参数为移动端或 PC 用户创建不同的构建。具体配置如下:

cache: {

name: `${env.target}`

}

性能优化

对大部分 nodemodules 进行哈希处理并加盖时间戳以生存构建和常规依赖项,其代价非常昂贵,并且还会大大降低 webpack 的执行速度。为避免这种情况出现,webpack 引入了相关的性能优化,默认情况下会跳过 nodemodules,并使用 package.json 中的 version 和 name 作为数据源。

此优化将用于配置项 cache.managedPaths 中的所有 path。它默认为 webpack 安装了 node_modules 目录。

启用此优化后,请勿手动编辑 node_modules。你可以使用 cache.managedPaths: [] 禁用它。

当使用 Yarn PnP 时,将启用另一个优化。由于缓存内容不可变,yarn 缓存中的所有文件都将完全跳过哈希和时间戳的操作(甚至不会追踪 version 和 name)。

此操作由配置项 cache.immutablePaths 控制。启用 Yarn PnP 时,默认为安装了 webpack 的 yarn 缓存。

不要手动编辑 yarn 缓存,因为这根本不可行。

使用持久化缓存

确保你已阅读并理解以上信息!

此为启用持久化缓存的典型配置:

cache: {

type: "filesystem",

buildDependencies: {

config: [ __filename ] // 当你 CLI 自动添加它时,你可以忽略它

}

}

Watching

持久化缓存可用于单独构建和连续构建(watch)。

当设置 cache.type: "filesystem" 时,webpack 会在内部以分层方式启用文件系统缓存和内存缓存。从缓存读取时,会先查看内存缓存,如果内存缓存未找到,则降级到文件系统缓存。写入缓存将同时写入内存缓存和文件系统缓存。

文件系统缓存不会直接将对磁盘写入的请求进行序列化。它将等到编译过程完成且编译器处于空闲状态才会执行。如此处理的原因是序列化和磁盘写入会占用资源,并且我们不想额外延迟编译过程。

针对单一构建,其工作流为:

  • Loading cache

  • Building

  • Emitting

  • Display results (stats)

  • Persisting cache (if changed)

  • Process exits

针对连续构建(watch),其工作流为:

  • Loading cache

  • Building

  • Emitting

  • Display results (stats)

  • Attach filesystem watchers

  • Wait cache.idleTimeoutForInitialStore

  • Persisting cache (if changed)

On change:

  • Building

  • Emitting

  • Display results (stats)

  • Wait cache.idleTimeout

  • Persisting cache (if changed)

你会发现两个新的配置项 cache.idleTimeout 和 cache.idleTimeoutForInitialStore,它们控制着持久化缓存之前编译器必须空闲的时长。cache.idleTimeout 默认为 60s,cache.idleTimeoutForInitialStore 默认为 0s。由于序列化阻止了事件循环,因此在序列化缓存时不进行缓存检测。此延迟尝试避免由于快速编辑文件,而在 watch 模式下导致重新编译造成的延迟,同时尝试为下一次冷启动保持持久化缓存的最新状态。这是一个折中的解决方案,可以设置适合你工作流的值。较小的值会缩短冷启动时间,但会增加延迟重新构建的风险。

错误处理

发生错误要恢复持久化缓存的方式,可以通过删除整个缓存并进行全新的构建,或者通过删除有问题的缓存 entry 并使得该项目保持未缓存状态来进行。

在这种情况下,webpack 的 logger 会发出警告。欲了解更多,请参阅 infrastructureLogging 的配置项。

Details

正常使用不需要以下信息。

使用 webpack 的高级工具指南

封装 webpack 的工具可以选择其他默认值。当不允许使用自定义扩展的 webpack 时,由于可以完全控制所有构建的依赖项,因此可以默认打开持久化存储。

CLI 指南

默认情况下,使用 webpack 的 CLI 可能会添加一些构建依赖关系,而 webpack 本身不会。

  • 默认情况下,CLI 会将 cache.buildDependencies.defaultConfig 设置为所用的配置文件

  • CLI 会将命令行参数附加到 cache.version

  • 使用命令行参数时,CLI 可能会在 cache.name 中添加注释。

调试信息

使用如下配置,将输出额外的调试信息:

infrastructureLogging: {

debug: /webpack\.cache/

}

内部工作流

webpack 读取缓存文件。

  • 没有缓存文件 -> 未构建缓存

  • 缓存文件中的 version 与 cache.version 不匹配 -> 没有构建缓存

webpack 将解析快照(resolve snapshot)与文件系统进行对比

  • 匹配到 -> 继续后续流程

  • 没有匹配到:

    • 再次解析所有解析结果(resolve results)

    • 没有匹配到 -> 未构建缓存

    • 匹配到 -> 继续后续流程

webpack 将构建依赖快照(build dependencies snapshot)与文件系统进行对比

  • 没有匹配到 -> 未构建缓存

  • 匹配到 -> 继续后续流程

对缓存 entry 进行反序列化(在构建过程中对较大的缓存 entry 进行延迟反序列化)

构建运行(有缓存或没有缓存)

  • 追踪构建依赖关系

    • 追踪 cache.buildDependencies

    • 追踪已使用的 loader

新的构建依赖关系已解析完成

  • 解析依赖关系已追踪

  • 解析结果已追踪

创建来自所有新解析依赖项的快照

创建来自所有新构建依赖项的快照

持久化缓存文件序列化到磁盘

序列化

所有支持序列化的 class 都需要注册一个序列化器:

webpack.util.serialization.register(Constructor, request, name, serializer);

Constructor 应为一个 class 或构造器函数。对于任何需要序列化的对象的 object.constructor 将被用于查找序列化器(serializer)。

request 将被用于加载调用 register 模块。它应指向当前模块。它将以这种方式使用:require(request)。

name 被用于区分具有相同 request 的多个 register 调用。

serializer 是至少拥有 serialize 和 deserialize 两个方法的对象。

当需序列化对象时,请调用 serializer.serialize(object, context)。context 是至少拥有一个 write(anything) 方法的对象 此方法将内容写入输出流。传递的值也会被序列化。

当需要反序列化对象时,请调用 serializer.deserialize(context)。context 是至少拥有一个 read(): anything 方法的对象。此方法会反序列化输入流中的某些内容。deserialize 必须返回反序列化后的对象。

serialize 和 deserialize 应以相同的顺序读取和写入相同的对象。

示例:

// some-module/lib/MyClass.js

class MyClass {

constructor(a, b) {

this.a = a;

this.b = b;

this.c = undefined;

}

}

register(MyClass, "some-module/lib/MyClass", null, {

seralize(obj, { write }) {

write(obj.a);

write(obj.b);

write(obj.c);

}

deserialize({ read }) {

const obj = new MyClass(read(), read());

obj.c = read();

return obj;

}

});

基本数据类型和引用数据类型的序列化器都已被注册,即 string,number,Array,Set,Map,RegExp,plain objects,Error。

关于本文 译者:@QC-L 译文:https://mp.weixin.qq.com/s/sPb20xx-I64mifKa2N3YFQ 原文:https://github.com/QC-L/changelog-v5-cn/commit/2a060edd261183adbc1da49344a353c21b04c9b2

为你推荐

【PPT】the road to webpack 5

【第1498期】webpack loader机制源码解析

【第1702期】针对web开发者的浏览器缓存指南

写入缓存策略无法更改_【第1747期】webpack 5 之持久化缓存指南相关推荐

  1. 安卓网络数据缓存策略

    如有转载,请申明: 转载至 http://blog.csdn.net/qq_35064774/article/details/53449779 前言 对于大部分 App 来说,网络请求都是必不可少的, ...

  2. 彻底弄懂 HTTP 缓存机制 —— 基于缓存策略三要素分解法

    导语 HTTP 缓存机制作为 Web 性能优化的重要手段,对从事 Web 开发的小伙伴们来说是必须要掌握的知识,但最近我遇到了几个缓存头设置相关的题目,发现有好几道题答错了,有的甚至在知道了正确答案后 ...

  3. 【腾讯Bugly干货分享】彻底弄懂 Http 缓存机制 - 基于缓存策略三要素分解法

    本文来自于腾讯Bugly公众号(weixinBugly),未经作者同意,请勿转载,原文地址:https://mp.weixin.qq.com/s/qOMO0LIdA47j3RjhbCWUEQ 作者:李 ...

  4. 看剧流畅还省电?视频类应用预缓存策略功耗评测详解

    你是否遇到过这样的问题,在疯狂追剧时手机电量消耗过快,一度以为是屏幕亮度等引起?但当在相同的屏幕亮度.音量.网络环境(WiFi网络)等条件下刷同一部剧,不同视频类应用的耗电量仍不同. 那么还有哪些因素 ...

  5. Glide 4.9源码解析-缓存策略

    本文Glide源码基于4.9,版本下载地址如下:Glide 4.9 前言 在分析了Glide的图片加载流程后,更加发觉到Glide的强大,于是这篇文章将继续深入分析Glide的缓存策略.不过今天的文章 ...

  6. wkwebview 文件服务器,WKWebView 的缓存策略

    缓存策略有以下四种方式: 默认的NSURLRequest 缓存策略 后台需要做响应头设置,否则无法进行缓存.存在cache目录,n磁盘紧张会被清除 NSURLCache 和上面类似.可以不需要后台设置 ...

  7. 离线缓存占内存吗_彻底弄懂浏览器缓存策略

    浏览器缓存策略对于前端开发同学来说不陌生,大家都有一定的了解,但如果没有系统的归纳总结,可能三言两语很难说明白,甚至说错,尤其在面试过程中感触颇深,很多候选人对这类基础知识竟然都是一知半解,说出几个概 ...

  8. okhttp配置缓存策略_网站的缓存控制策略最佳实践及注意事项

    对于一个网站来讲,性能关乎用户体验,你在更短的时间内打开网站,你将会留住更多的用户.如果你的页面十秒才能打开,那再好的用户交互也是徒然. 缓存控制是网站性能优化中至为常见及重要的一环,好的缓存控制,除 ...

  9. @cacheable 是否缓存成功_缓存策略:如何使用缓存来减少磁盘IO?

    现代的消息队列,都使用磁盘文件来存储消息.因为磁盘是一个持久化的存储,即使服务器掉电也不会丢失数据.绝大多数用于生产系统的服务器,都会使用多块儿磁盘组成磁盘阵列,这样不仅服务器掉电不会丢失数据,即使其 ...

最新文章

  1. 回复 集赞 抢 《Apple Watch 苹果开发教程》活动开始了!!!
  2. 【工业控制】How to Optimize a Waveform
  3. RHEL6入门系列之十,常用命令3
  4. 一个memset函数使用时的坑
  5. html背景动起来,CSS+HTML 循环滚动背景效果
  6. 2019.01.21 bzoj2441: [中山市选2011]小W的问题(树状数组+权值线段树)
  7. 在java中通过过键盘输入_java中从键盘输入
  8. python中 n是换几行_如何在Python中用`\ n`替换通用换行符?
  9. Executors 工具类,三大方法
  10. 【不能执行已释放的 sript 代码】 已解决 命名【疾风】
  11. 这么有料的福利,你还不赶紧关注一波吗?(代码合集)
  12. (翻译)社会认同模式(Social proof)
  13. 关于爬网易云音乐时使用fiddler调试JS遇到的问题?
  14. 下载到的电子书格式是Mobi,这种格式能否在MAC电脑上打开?
  15. 达梦数据库常用sql
  16. php微博毕业论文,php校园微博网站
  17. python黑客库长安十二时辰 更新_爬取3万+评论,告诉你究竟是哪些人不喜欢《长安十二时辰》?...
  18. SpringBoot2入门教程
  19. Java实现手机发送短信验证码
  20. fiddler安装证书失败

热门文章

  1. java转账_使用Java模拟银行账户存、取款、转账功能
  2. java中utilities类_Java PHUtilities类代码示例
  3. 汇编 int 10h
  4. 计算机名字更改时不显示文字,教大家电脑中文件夹不显示名字怎么办
  5. c语言编程学生管理,c语言编程,关于学生管理的程序(急急急)
  6. 液晶字体数字一到九_睡前必听3分钟系列十一:光传输设备和同步数字体系的特点...
  7. Java没有panel_java panel 问题
  8. mysql mydumper_采用mydumper对MySQL部分数据库进行热备
  9. java缓存技术选型,重难点整理
  10. Java程序员必看!2021最新爱奇艺Java社招面试题目