点击上方蓝字关注我们

npm 是 Node.js 默认的、以 JavaScript 编写的包管理工具,如今,它已经成为世界上最大的包管理工具,是每个前端开发者必备的工具。不知你是否遇到过下面问题:

哎?我本地明明是好的,线上的依赖怎么就报错不行了呢?一言不合就删除整个node_modules目录然后重新npm install

今天我们聊聊npm模块相关的东西。

semver

npm 依赖管理的一个重要特性是采用了语义化版本 (semver) 规范,作为依赖版本管理方案。

semver规定的模块版本号格式为:MAJOR.MINOR.PATCH,即主版本号.次版本号.修订号。版本号递增规则如下:

  1. 主版本号:当你做了不兼容的 API 修改,例如新增了breaking change。

  2. 次版本号:当你做了向下兼容的功能性新增,例如新增feature。

  3. 修订号:当你做了向下兼容的问题,例如修复bug。

对于npm包的引用者来说,经常会在package.json文件里面看到使用semver约定的semver range来指定所需的依赖包版本号和版本范围。常用的规则如下表:

此外,任意两条规则,用空格连接起来,表示“与”逻辑,即两条规则的交集: 如 >=2.3.1 <=2.8.0 可以解读为: >=2.3.1 且 <=2.8.0

任意两条规则,通过 || 连接起来,表示“或”逻辑,即两条规则的并集: 如 ^2 >=2.3.1 || ^3 >3.2

在修订版本号的后面可以加上其他信息,用-连接,比如:

  • X.Y.Z-Alpha: 内测版

  • X.Y.Z-Beta: 公测版

  • X.Y.Z-Stable: 稳定版

从 npm install 说起

npm install 命令用来安装模块到 node_modules 目录。npm install 的具体原理是什么呢?

执行工程自身 preinstall

确定首层依赖模块

首层依赖是 package.json 中 dependencies 和 devDependencies 字段直接指定的模块。每一个首层依赖模块都是模块依赖树根节点下面的一颗子树。

获取模块

获取模块是一个递归的过程,分为以下几步:

  1. 获取模块信息。在下载一个模块之前,首先要确定其版本,这是因为 package.json 中的模块版本往往是 semantic version。此时根据package.json和版本描述文件(npm-shrinkwrap.json 或 package-lock.json不同npm版本的策略不同,后续我们会详细介绍)。如 package.json 中某个包的版本是 ^1.1.0,npm 就会去仓库中获取符合1.x.x形式的最新版本。

  2. 获取模块实体。上一步会获取到模块的压缩包地址(resolved 字段),npm 会用此地址检查本地缓存,缓存中有就直接拿,如果没有则从仓库下载。

  3. 查找该模块依赖,如果有依赖则回到第1步,如果没有则停止。

模块扁平化 (npm3 后支持)

上一步获取到的是一颗完整的依赖树,下面会根据依赖树安装模块。模块安装机制有两种:嵌套式安装机制 和 扁平式安装机制。

例如某工程下直接依赖了A和B两个包,且他们同时依赖了C包。

  • 嵌套式

npm3之前使用的是嵌套式安装机制,严格按照依赖树的结构进行安装,这可能会造成相同模块大量冗余的问题。

  • 扁平式

npm3之后使用的扁平式安装机制,但是需要考虑一个问题:

工程同时依赖一个模块不同版本该如何解决?

npm3 引入了 dedupe 过程来解决这个问题。它会遍历所有节点,逐个将模块放在根节点下面,也就是 node-modules 的第一层。当发现有重复模块时,则将其丢弃。

重复模块:semver兼容的相同模块。例如lodash ^1.2.0lodash ^1.4.0。如果工程的两个模块版本范围存在交集,就可以得到一个 兼容版本,不必版本号完全一致,这可以使得更多冗余模块在dedupe过程中被去掉。

上例中如果A包依赖C@1.0.0,B包依赖C@2.0.0,此时两个版本并不兼容,则后面的版本仍会保留在依赖书中。如下图所示:

实际上,npm3仍然可能出现模块冗余的情况,如下图,因为一级目录下已经有C@1.0.0,所以所有的C@2.0.0只能作为二级依赖模块被安装:

npm提供了 npm dedupe 指令来优化依赖树结构。这个命令会去搜索本地的node_modules中的包,并且通过移动相同的依赖包到外层目录去尽量简化这种依赖树的结构,让公用包更加有效被引用。

安装模块

将会更新工程中的 node_modules,并执行模块中的生命周期函数(按照 preinstall、install、postinstall 的顺序)

执行工程自身生命周期

当前 npm 工程如果定义了钩子此时会被执行(按照 install、postinstall、prepublish、prepare 的顺序)。最后生成或者更新版本描述文件。

锁定npm依赖版本


你是否遇到过本地开发时一切正常,发布线上代码时因为安装依赖的错误导致服务不可用?如果是的话,你要一份版本描述文件。

简单的写死当前工程依赖模块的版本并不能真正锁定依赖版本,因为你无法控制间接依赖,如果间接依赖更新了有问题的模块,你的系统还是可能会有宕机的风险。

lock 文件是当前依赖关系树的快照,允许不同机器间的重复构建。其实 npm5 之前已经提供了lock文件—— npm-shrinkwrap.json。但是在 npm5 发布的时候创建了新的lock文件—— package-lock.json,其主要目的是希望能更好的传达一个消息,npm真正支持了locking机制。不过二者还是有一些区别点:

  1. 发布npm包时,package-lock.json 不会被发布, 即使你将其显式添加到软件包的 files 属性中,它也不会是已发布软件包的一部分。npm-shrinkwrap.json 可以被发布。

  2. npm-shrinkwrap.json向后兼容npm2、3、4版本,package-lock.json 只有 npm5 以上支持。

  3. 可以通过npm shrinkwrap命令将package-lock.json转换成npm-shrinkwrap.json, 因为文件的格式是完全一样的。

曲折的package-lock.json

查阅资料得知,自npm 5.0版本发布以来,package-lock.json的规则发生了三次变化。

  1. npm 5.0.x版本,不管 package.json 怎么变,npm install都会根据lock文件下载。npm/npm#16866 控诉了这个问题,我明明手动改了 package.json ,为啥不给我升包!然后就导致5.1.0的问题(是个bug)

  2. npm 5.1.0 - 5.4.1版本,npm insall会无视lock文件,去下载semver兼容的最新的包。导致lock文件并不能完全锁住依赖树。详情见npm/npm#17979

  3. npm 5.4.2版本之后,如果手动改了package.json,且package.json和lock文件不同,那么执行npm install时 npm 会根据 package 中的版本号和语义含义去下载最新的包,并更新至 lock。

    如果两者是同一状态,那么执行 npm install都会根据 lock 下载,不会理会 package 实际包的版本是否更新。

好的依赖管理方案

  • 使用 npm: >=5.4.2 版本, 保持 package-lock.json 文件默认开启配置

  • 初始化:第一作者初始化项目时使用 npm install  安装依赖包, 默认保存 ^X.Y.Z 依赖 range 到 package.json 中; 提交 package.json, package-lock.json, 不要提交 node_modules 目录

  • 初始化:项目成员首次 checkout/clone 项目代码后,执行一次 npm install 安装依赖包

  • 升级依赖包:

    • 升级小版本: 本地执行 npm update 升级到新的小版本

    • 升级大版本: 本地执行

npm install @
  • 升级到新的大版本

  • 也可手动修改 package.json 中版本号为要升级的版本(大于现有版本号)并指定所需的 semver, 然后执行 npm install

  • 本地验证升级后新版本无问题后,提交新的 package.json, package-lock.json 文件

降级依赖包:

正确:

 npm install @

验证无问题后,提交 package.json 和 package-lock.json 文件

删除依赖包:

  • Plan A:

npm uninstall 

并提交 package.json 和 package-lock.json

  • Plan B: 把要卸载的包从 package.json 中 dependencies 字段删除, 然后执行 npm install 并提交 package.json 和 package-lock.json

任何时候有人提交了 package.json, package-lock.json 更新后,团队其他成员应在 svn update/git pull 拉取更新后执行 npm install 脚本安装更新后的依赖包

不要手动修改 package-lock.json

当 package-lock.json 出现冲突时,这种是非常棘手的情况,最好不要手动解决冲突,如果有一处冲突解决不正确可能会导致线上事故。
建议的做法:将本地的 package-lock.json文件删除,引入远程的 package-lock.json 文件,再执行npm install命令更新package-lock.json文件。

(这种做法能保证未修改的依赖不变,会存在一个风险:在执行npm install的时候,可能有些间接依赖包升级,根据semver兼容原则导致本次安装的和开发时的package-lock.json文件不同。这种情况就需要验证依赖包升级是否有影响)

部署安装依赖时,执行npm install命令。不要执行

npm install

命令,因为这会导致 package-lock.json 文件同时被更新。

问题来了

上述最佳实践提到了当团队中有成员提交了 package.json, package-lock.json 更新后,其他成员需要执行 npm install 来保证本地依赖的及时性,那么能否写一个插件将这个手动的环节自动化呢?答案是可以的,我们只需要在 git post-merge 钩子中检查

git diff files(git diff-tree -r --name-only --no-commit-id HEAD@{1} HEAD)

是否包含了 package.json 文件,如果包含了该文件,则执行npm install命令。我们暂且给这个插件取名为 hawkeye 。当然,这个插件能干的事情不仅于此。

不知作为读者的你听到上述场景描述后,是否有种似曾相识的感觉?没错,lint-staged。

lint-staged,从git staged files变化中匹配你想要的文件,再执行你配置的commands。

Hawkeye,从git diff files变化中匹配你想要的文件,再执行你配置的commands。

需要注意的是,他们都依赖于husky改造git hooks的能力。

实现方案

例子

假设有一个已经安装了 hawkeye 和 husky 的项目, package.json 如下:

{  "name": "My project",  "version": "0.1.0",  "scripts": {  },  "husky": {    "hooks": {      "post-merge": "hawkeye"    }  },  "hawkeye": {    "package.json": ["npm install"]  }}

相关链接


  • semver 语义化版本

    https://semver.org/lang/zh-CN/?spm=ata.13261165.0.0.552e2688ZKTpgz

  • semver(1) -- The semantic versioner for npm

    https://github.com/npm/node-semver?spm=ata.13261165.0.0.552e2688ZKTpgz

  • 2018 年了,你还是只会 npm install 吗?

    https://juejin.im/post/5ab3f77df265da2392364341?spm=ata.13261165.0.0.552e2688ZKTpgz

  • npm install algorithm

    https://docs.npmjs.com/cli/install?spm=ata.13261165.0.0.552e2688ZKTpgz#algorithm

  • npm dedupe

    https://docs.npmjs.com/cli/dedupe.html?spm=ata.13261165.0.0.552e2688ZKTpg

  • npm install的实现原理

    https://www.zhihu.com/question/66629910?spm=ata.13261165.0.0.552e2688ZKTpgz

  • [译] 理解 NPM 5 中的 lock 文件

    https://juejin.im/post/5943849aac502e006b84ce07?spm=ata.13261165.0.0.552e2688ZKTpgz

  • package-lock.json file not updated after package.json file is changed

    https://github.com/npm/npm/issues/16866?spm=ata.13261165.0.0.552e2688ZKTpgz

  • why is package-lock being ignored?

    https://github.com/npm/npm/issues/17979?spm=ata.13261165.0.0.552e2688ZKTpgz

  • lint-staged

    https://github.com/okonet/lint-staged?spm=ata.13261165.0.0.552e2688ZKTpgz

  • hawkeye

    https://github.com/stormqx/hawkeye?spm=ata.13261165.0.0.552e2688ZKTpgz

推荐阅读

我的公众号能带来什么价值?(文末有送书规则,一定要看)每个前端工程师都应该了解的图片知识(长文建议收藏)为什么现在面试总是面试造火箭?

install npm 到某个文件下执行_你可能不知道的 npm 依赖管理那些事相关推荐

  1. install npm 到某个文件下执行_如何将npm安装到指定目录?

    从npm版本3.8.6开始,您可以使用 npm install --prefix ./install/here 安装在指定的目录中.node_modules即使node_modules较高层次结构中已 ...

  2. 在linux文件下执行.kjb文件和trans文件

    – 执行kjb文件 先找到kitchen.sh文件所在的位置 新建一个sh文件(runKjbScript.sh),在文件中添加如下代码: kitchen.sh路径/kitchen.sh -file= ...

  3. .sql文件如何执行_深入理解SQL原理:SQL查询语句是如何执行的?

    本篇文章将通过一条 SQL 的执行过程来介绍 MySQL 的基础架构. 首先有一个 user_info 表,表里有一个 id 字段,执行下面这条查询语句: select * from user_inf ...

  4. c++exe程序在别人电脑上双击无法打开_你可能不知道的电脑软件打开方式总结!

    目录 通过可执行exe文件(本质) 通过快捷方式(较快) 通过任务栏(最快) 通过运行(高大上) 通过搜索(常用,较快) 写在最后(总结) 通过可执行exe文件(本质) 可执行文件以`.exe`结尾的 ...

  5. .sql文件如何执行_随手记 02 日志系统:一条SQL更新语句是如何执行的?

    上节系统了解了一个查询语句的执行流程,并介绍了执行过程中涉及的出合理模块. 连接器.分析器.优化器.执行器等功能模块,最后到达存储引擎. 一条SQL更新语句的执行流程 从一个表的一条sql语句说起 c ...

  6. python引入文件并执行_文件操作和导入os模块执行文件和目录管理操作

    文件概念以及文本文件和二进制文件的区别 计算机的CPU如果想要访问保存在磁盘上的文件,第一步需要把磁盘上的文件数据加载到内存中.因为内存的读写速度要比磁盘的读写速度快很多. 计算机只能识别0101这种 ...

  7. linux 文件可执行_深入理解linux内核——可执行文件执行过程(2)

    接上篇.. 13.调用do_mmap()函数创建一个新线性区来对可执行文件正文段(即代码)进行映射.这个线性区的起始线性地址依赖于可执行文件的格式,因为程序的可执行代码通常是不可重定位的.因此,这个函 ...

  8. screnc加密后文件不能执行_芯片加密后还能不能再次使用【详细介绍】

    随着信息技术的发展,信息的载体-芯片的运用也越来越多了,随之而来的芯片安全性的要求也越来越高了,各个芯片厂商对芯片保密性要求越来越高,芯片的加密,保证了芯片中的信息的安全性.经常有客户打电话过来问,这 ...

  9. .sql文件如何执行_一条SQL查询语句是如何执行的?

    导读 Mysql在中小型企业中是个香饽饽,目前主流的数据库之一,几乎没有一个后端开发者不会使用的,但是作为一个老司机,仅仅会用真的不够. 今天透过一个简单的查询语句来讲述在Mysql内部的执行过程. ...

最新文章

  1. 使用StateServer机制来解决session丢失而造成用户验证失败
  2. 50. Pow(x, n)(递归,穷举)
  3. Jmeter 安装各个历史版本
  4. JAVA多线程实现案例
  5. udhcpc 移植和使用
  6. 微信小程序——图片识别
  7. 代码审计jizhiCMS 后台getshell
  8. HOG+ADABOOST方式训练头肩检测模型
  9. 服务器远程关机后开机开不了,远程开关机系统安全吗
  10. windows上连接ubuntu的向日葵,总是显示正在连接,马上就是连接已断开
  11. Oracle字符集的简单图解,中文乱码解决
  12. 计算机显示器画画的清晰度,如何设置显示器分辨率让画面更清晰
  13. redis配置信息解读
  14. Windows下安装Oracle11g数据库
  15. 如何计算IT投资回报(ROI)
  16. RTX30系列-Ubuntu系统配置与深度学习环境Pytorch配置
  17. 彻底解决MySQL导入Excel无法打开Excel的问题
  18. linux amd显卡双屏,显示器的合理利用 ati显卡双屏详细设置【图文】
  19. 【Python】常用小代码
  20. thinkpad选择启动项_联想thinkpad笔记本新老机型bios设置u盘启动详细教程

热门文章

  1. 读《深入分析Java Web技术内幕》
  2. 刚安装Vs2008,安装时它弹出了一个一些常见问题的解决方案页,记录下
  3. css3点击会移动到点,CSS3过渡点击事件
  4. 浏览器打印设置横向打印_爱普生打印机无线连接设置
  5. 操作系统上机作业-- 使用信号量解决生产者、计算者、消费者问题(多线程)
  6. java 方法 示例_带有示例的Java EnumSetSupplementOf()方法
  7. kotlin 或 运算_Kotlin程序对两个数字执行算术运算
  8. Java PushbackInputStream markSupported()方法与示例
  9. 使用JavaScript中的示例编号MAX_VALUE属性
  10. linux内核设计与实现---进程管理