抽象语法树是什么

在计算机科学中,抽象语法树(abstract syntax tree 或者缩写为 AST),或者语法树(syntax tree),是源代码的抽象语法结构的树状表现形式,这里特指编程语言的源代码。树上的每个节点都表示源代码中的一种结构。之所以说语法是「抽象」的,是因为这里的语法并不会表示出真实语法中出现的每个细节。1

果然比较抽象,不如先看几个例子:

抽象语法树举例

foo = 'hello world';
/*+-------------+             |  assign(=)  |             +-------------+             X        X               X          X
+-------+    +-----------------+
|  foo  |    |  'hello world'  |
+-------+    +-----------------+
*/
if (foo === true) {bar = 'hello world';alert(bar);
}
/*+------+                                    |  if  |                                    +------+                                    X    X                                     X        X                                   +--------------+    +-------------+                       |  equal(===)  |    |  if_body    |                       +--------------+    +-------------+                       X        X              X         X                       X         X                X          X
+-------+   +--------+    +-------------+   +------------+
|  foo  |   |  true  |    |  assign(=)  |   |  alert()   |
+-------+   +--------+    +-------------+   +------------+         X        X                  X         X            X                  X       +-------+   +-----------------+    +-------+|  bar  |   |  'hello world'  |    |  bar  |+-------+   +-----------------+    +-------+
*/

从上述两个例子可以看出,抽象语法树是将源代码根据其语法结构,省略一些细节(比如:括号没有生成节点),抽象成树形表达。

抽象语法树在计算机科学中有很多应用,比如编译器、IDE、压缩优化代码等。下面介绍一下抽象语法树在 JavaScript 中的应用。

JavaScript 抽象语法树

构造 JavaScript 抽象语法树有多种工具,比如 v8、SpiderMonkey、UglifyJS 等,这里重点介绍 UglifyJS。

UglifyJS

UglifyJS 是使用最广的 JavaScript 压缩工具之一,而且自身也是用 JavaScript 写的,使用它的方法很简单(需要 nodejs 环境):

首先全局安装:

[sudo ]npm install -g uglify-js

然后就可以使用了:

uglifyjs -m srcFileName.js -o destFileName.min.js

关于 UglifyJS 的用法这里就不多介绍了,我们要做的是一些更有趣的事情。

UglifyJS Tools

UglifyJS 提供了一些工具用于分析 JavaScript 代码,包括:

  • parser,把 JavaScript 代码解析成抽象语法树
  • code generator,通过抽象语法树生成代码
  • mangler,混淆 JavaScript 代码
  • scope analyzer,分析变量定义的工具
  • tree walker,遍历树节点
  • tree transformer,改变树节点

生成抽象语法树

使用 UglifyJS 生成抽象语法树很简单:

首先安装 UglifyJS 为 npm 包:

npm install uglify-js --save-dev

然后使用 parse 方法即可:

var UglifyJS = require('uglify-js');var ast = UglifyJS.parse('function sum(foo, bar){ return foo + bar; }');

这样生成的 ast 即为那一段代码的抽象语法树。那么我们怎么使用呢?

使用 mangler 压缩代码

使用 mangler 可以通过将局部变量都缩短成一个字符来压缩代码。

var UglifyJS = require('uglify-js');var ast = UglifyJS.parse('function sum(foo, bar){ return foo + bar; }');
ast.figure_out_scope();
ast.mangle_names();
console.log(ast.print_to_string());
// function sum(a,b){return a+b}

使用 walker 遍历抽象语法树

使用 walker 可以遍历抽象语法树,这种遍历是深度遍历。

var UglifyJS = require('uglify-js');var ast = UglifyJS.parse('function sum(foo, bar){ return foo + bar; }');
ast.figure_out_scope();
ast.walk(new UglifyJS.TreeWalker(function(node) {console.log(node.print_to_string());
}));
/*
function sum(foo,bar){return foo+bar}
function sum(foo,bar){return foo+bar}
sum
foo
bar
return foo+bar
foo+bar
foo
bar
*/

UglifyJS 已经提供了直接压缩代码的脚本,walker 看上去貌似也没啥用,那么这些工具有什么使用场景呢?

抽象语法树的应用

利用抽象语法树重构 JavaScript 代码

假如我们有重构 JavaScript 的需求,它们就派上用场啦。

下面考虑这样一个需求:

我们知道,parseInt 用于将字符串变成整数,但是它有第二个参数,表示以几进制识别字符串,若没有传第二个参数,则会自行判断,比如:

parseInt('10.23');     // 10            转换成正整数
parseInt('10abc');     // 10            忽略其他字符
parseInt('10', 10);    // 10            转换成十进制
parseInt('10', 2);     // 2             转换成二进制
parseInt('0123');      // 83 or 123     不同浏览器不一样,低版本浏览器会转换成八进制
parseInt('0x11');      // 17            转换成十六进制

因为有一些情况是和我们预期不同的,所以建议任何时候都加上第二个参数。

下面希望有一个脚本,查看所有 parseInt 有没有第二个参数,没有的话加上第二个参数 10,表示以十进制识别字符串。

使用 UglifyJS 可以实现此功能:

#! /usr/bin/env nodevar U2 = require("uglify-js");function replace_parseint(code) {var ast = U2.parse(code);// accumulate `parseInt()` nodes in this arrayvar parseint_nodes = [];ast.walk(new U2.TreeWalker(function(node){if (node instanceof U2.AST_Call&& node.expression.print_to_string() === 'parseInt'&& node.args.length === 1) {parseint_nodes.push(node);}}));// now go through the nodes backwards and replace codefor (var i = parseint_nodes.length; --i >= 0;) {var node = parseint_nodes[i];var start_pos = node.start.pos;var end_pos = node.end.endpos;node.args.push(new U2.AST_Number({value: 10}));var replacement = node.print_to_string({ beautify: true });code = splice_string(code, start_pos, end_pos, replacement);}return code;
}function splice_string(str, begin, end, replacement) {return str.substr(0, begin) + replacement + str.substr(end);
}// test itfunction test() {if (foo) {parseInt('12342');}parseInt('0012', 3);
}console.log(replace_parseint(test.toString()));/*
function test() {if (foo) {parseInt("12342", 10);}parseInt('0012', 3);
}
*/

在这里,使用了 walker 找到 parseInt 调用的地方,然后检查是否有第二个参数,没有的话,记录下来,之后根据每个记录,用新的包含第二个参数的内容替换掉原内容,完成代码的重构。

也许有人会问,这种简单的情况,用正则匹配也可以方便的替换,干嘛要用抽象语法树呢?

答案就是,抽象语法树是通过分析语法实现的,有一些正则无法(或者很难)做到的优势,比如,parseInt() 整个是一个字符串,或者在注释中,此种情况会被正则误判

var foo = 'parseInt("12345")';
// parseInt("12345");

抽象语法树在美团中的应用

在美团前端团队,我们使用 YUI 作为前端底层框架,之前面临的一个实际问题是,模块之间的依赖关系容易出现疏漏。比如:

YUI.add('mod1', function(Y) {Y.one('#button1').simulate('click');Y.Array.each(array, fn);Y.mod1 = function() {/**/};
}, '', {requires: ['node','array-extras']
});
YUI.add('mod2', function(Y) {Y.mod1();// Y.io(uri, config);
}, '', {requires: ['mod1','io']
});

以上代码定义了两个模块,其中 mod1 模拟点击了一下 idbutton1 的元素,执行了 Y.Array.each,然后定义了方法 Y.mod1,最后声明了依赖 nodearray-extrasmod2 执行了 mod1 中定义的方法,而 Y.io 被注释了,最后声明了依赖 mod1io

此处 mod1 出现了两个常见错误,一个是 simulateY.Node.prototype 上的方法,容易忘掉声明依赖 node-event-simulate3,另一个是 Y.Array 上只有部分方法需要依赖 array-extras,故此处多声明了依赖 array-extras4mod2 中添加注释后,容易忘记删除原来写的依赖 io

故正确的依赖关系应该如下:

YUI.add('mod1', function(Y) {Y.one('#button1').simulate('click');Y.Array.each(array, fn);Y.mod1 = function() {/**/};
}, '', {requires: ['node','node-event-simulate']
});
YUI.add('mod2', function(Y) {Y.mod1();// Y.io(uri, config);
}, '', {requires: ['mod1']
});

为了使模块依赖关系的检测自动化,我们创建了模块依赖关系检测工具,它利用抽象语法树,分析出定义了哪些接口,使用了哪些接口,然后查找这些接口应该依赖哪些模块,进而找到模块依赖关系的错误,大致的过程如下:

  1. 找到代码中模块定义(YUI.add)的部分
  2. 分析每个模块内函数定义,变量定义,赋值语句等,找出符合要求(以 Y 开头)的输出接口(如 mod1 中的 Y.mod1
  3. 生成「接口 - 模块」对应关系
  4. 分析每个模块内函数调用,变量使用等,找出符合要求的输入接口(如 mod2 中的 Y.oneY.Array.eachY.mod1
  5. 通过「接口 - 模块」对应关系,找到此模块应该依赖哪些其他模块
  6. 分析 requires 中是否有错误

使用此工具,保证每次提交代码时,依赖关系都是正确无误的,它帮助我们实现了模块依赖关系检测的自动化。

总结

抽象语法树在计算机领域中应用广泛,以上仅讨论了抽象语法树在 JavaScript 中的一些应用,期待更多的用法等着大家去尝试和探索。

Reference

  1. Wikipedia AST
  2. UglifyJS
  3. node-event-simulate
  4. Y.Array.each

发现文章有错误、对内容有疑问,都可以关注美团点评技术团队微信公众号(meituantech),在后台给我们留言。我们每周会挑选出一位热心小伙伴,送上一份精美的小礼品。快来扫码关注我们吧!

抽象语法树在 JavaScript 中的应用相关推荐

  1. 利用抽象语法树检查Python中“未定义”的变量名

    其实,Python是一种真正的动态语言,代码中的变量名本没有"声明"或"定义"的说法,语言本身也没有提供声明或定义变量的特殊语法(global除外).对程序员来 ...

  2. python 抽象语法树_抽象语法树(Abstract Syntax Tree)

    一般来说,程序中的一段源代码在执行之前会经历下面三个步骤 1 分词/词法分析 这个过程会将由字符组成的字符串分解成有意义的代码快,这些代码块被称为词法单元.例如 var a = 4:会被分解成 var ...

  3. AST(抽象语法树)实战入门:js逆向中滑块加密if语句转化

    概述:AST 抽象语法树 实战 入门 案例 js逆向 js滑块 js加密 极验 瑞数 阿里滑块 5秒盾 ​引言: AST算得上是高端技能.如果把爬虫技能分为初中高三个阶段的话.常规的JS逆向找找参数, ...

  4. 应用ast抽象语法树修改js函数

    原理:AST抽象语法树 目标:在每一个函数里面插入一个console.log()把函数传入的全部参数输出出来 关于:本文章是在基于我的个人理解且怕忘记知识所记录下来的给自己看并且分享自己的一个心得,文 ...

  5. AST(抽象语法树)超详细

    自己研究的东西会用到AST,就自己通过查阅资料,整理一下. 本文目录 第一部分:AST的作用 第二部分:AST的流程 第三部分: Eclipse AST的获取与访问 第一部分:AST的作用 首先来一个 ...

  6. 抽象语法树 -Abstract Syntax Tree

    什么是抽象语法树? 是源代码结构的一种抽象表示,以树状的形式表现编程语言的语法结构.树上的每个节点都表示源代码中的一种结构. 拆分成语法树 拆解一个简单的add函数 function add(a, b ...

  7. ast抽象语法树_新抽象语法树(AST)给 PHP7 带来的变化

    本文大部分内容参照 AST 的 RFC 文档而成:https://wiki.php.net/rfc/abstract_syntax_tree,为了易于理解从源文档中节选部分进行介绍. 我的官方群点击此 ...

  8. 编译原理抽象语法树_平衡抽象原理

    编译原理抽象语法树 使代码复杂易读和理解的一件事是,方法内部的指令处于不同的抽象级别. 假设我们的应用程序仅允许登录用户查看其朋友的旅行. 如果用户不是朋友,则不会显示任何行程. 一个例子: publ ...

  9. Scala的抽象语法树打印小工具-小拉达

    为什么80%的码农都做不了架构师?>>>    最近做的两个项目,一个是VeriScala,另一个是Lickitung,都涉及到了Scala的抽象语法树(AST),前者是写macro ...

最新文章

  1. 微信无法连接服务器501,微信成语猜猜看第501关BUG出现全是英文怎么过解决方法...
  2. POJ 3111 K Best (最大化平均值,贪心 二分)难度⭐⭐⭐
  3. 类 或 对象 的一些小点 【仅记录,方便以后查阅】
  4. windows 10 安装openssh 0x800f0954 的一种解决方法
  5. DNS枚举工具DNSenum
  6. 万维网发布服务 w3svc 已停止 除非万维_W3C万维网联盟宣布停止发布HTML 5.3版
  7. linux搭建ca服务器搭建,linux下安装EJBCA 搭建私有CA服务器
  8. 黄金白银、古董与收藏
  9. 如何在 IDEA 启动多个 Spring Boot 工程实例
  10. php curl保存位置,php – 使用cURL从URL保存图像
  11. 如何修复“您的系统已耗尽应用程序内存”错误
  12. gun linux定义,linux gun make 入门
  13. idea java代码格式化_IDEA java 代码格式化统一
  14. 苹果锁定计算机的快捷键,苹果电脑快捷键使用 Mac快捷键大全详细介绍
  15. idea Lombok插件下载
  16. 大学杂念集 随便写写
  17. 一直又爱又恨的jqueryValidate,看到一个还不错的laber.error样式
  18. 二叉树的后序遍历(递归和非递归)
  19. 人工智能未来替代的职位,主要有哪些行业?
  20. APISpace 让你快速获取名言警句

热门文章

  1. 函数<小罗爱c语言>
  2. 我的2021年度书单(主要教你面试怎么装B)
  3. HTML制作搞笑照片,搞怪相片大制作,个性搞怪照片,特效照片制作
  4. 金融申请评分卡(2)
  5. webstorm和网站制作
  6. python 调用函数实现——斐波纳契数列
  7. apple tv设置_如何设置Apple TV以自动安装iPhone的应用程序
  8. Javascript中引用数据类型
  9. Kmp算法之 求最大公共前后缀
  10. 数字图像处理(第三版)绪论笔记