作者:史宁宁(snsn1984)

首先我们确定下Clang编译器的详细内容和涵盖范围。之前在《LLVM每日谈之二十 Everything && Clang driver 》中以前提到过。Clang driver(命令行表示是clang)和Clang前端(依照详细实现来说就是Clang的那些库所实现的前端)是不同的。同一时候还存在一个Clang编译器(命令行表示是clang -cc1)。Clang编译器不只包括了Clang前端,还包括使用LLVM的哭实现的编译器的中间阶段以及后端,同一时候也集成了assembler。

Clang driver有一系列的frontend action,这些frontend action定义于clang/include/clang/Frontend/FrontendOptions.h中的ActionKind枚举中。

当中一些frontend action就会触发Clang编译器(clang -cc1),比方:ASTView, EmitBC, EmitObj等。一旦触发了Clang编译器(clang -cc1)。就会执行函数cc1_main()(clang/tools/driver/cc1_main.cpp),从名字上就能够看出来,这个函数是Clang编译器(clang -cc1)的入口主函数。

举个详细的样例来看一下:

min.c

int min(int a, int b) {if (a < b) {return a;}return b;
}

执行命令: clang -### min.c -o min

clang version 3.5.0 (tags/RELEASE_350/final)
Target: x86_64-unknown-linux-gnu
Thread model: posix"/home/shining/llvm-3.5/build/bin/clang-3.5" "-cc1" "-triple" "x86_64-unknown-linux-gnu" "-emit-obj" "-mrelax-all" "-disable-free" "-main-file-name" "min.c" "-mrelocation-model" "static" "-mdisable-fp-elim" "-fmath-errno" "-masm-verbose" "-mconstructor-aliases" "-munwind-tables" "-fuse-init-array" "-target-cpu" "x86-64" "-dwarf-column-info" "-resource-dir" "/home/shining/llvm-3.5/build/bin/../lib/clang/3.5.0" "-internal-isystem" "/usr/local/include" "-internal-isystem" "/home/shining/llvm-3.5/build/bin/../lib/clang/3.5.0/include" "-internal-externc-isystem" "/usr/include/x86_64-linux-gnu" "-internal-externc-isystem" "/include" "-internal-externc-isystem" "/usr/include" "-fdebug-compilation-dir" "/home/shining/llvm-3.5/build/bin" "-ferror-limit" "19" "-fmessage-length" "80" "-mstackrealign" "-fobjc-runtime=gcc" "-fdiagnostics-show-option" "-o" "/tmp/min-75c13b.o" "-x" "c" "min.c""/usr/bin/ld" "-z" "relro" "--hash-style=gnu" "--build-id" "--eh-frame-hdr" "-m" "elf_x86_64" "-dynamic-linker" "/lib64/ld-linux-x86-64.so.2" "-o" "min" "/usr/lib/gcc/x86_64-linux-gnu/4.8/../../../x86_64-linux-gnu/crt1.o" "/usr/lib/gcc/x86_64-linux-gnu/4.8/../../../x86_64-linux-gnu/crti.o" "/usr/lib/gcc/x86_64-linux-gnu/4.8/crtbegin.o" "-L/usr/lib/gcc/x86_64-linux-gnu/4.8" "-L/usr/lib/gcc/x86_64-linux-gnu/4.8/../../../x86_64-linux-gnu" "-L/lib/x86_64-linux-gnu" "-L/lib/../lib64" "-L/usr/lib/x86_64-linux-gnu" "-L/usr/lib/gcc/x86_64-linux-gnu/4.8/../../.." "-L/home/shining/llvm-3.5/build/bin/../lib" "-L/lib" "-L/usr/lib" "/tmp/min-75c13b.o" "-lgcc" "--as-needed" "-lgcc_s" "--no-as-needed" "-lc" "-lgcc" "--as-needed" "-lgcc_s" "--no-as-needed" "/usr/lib/gcc/x86_64-linux-gnu/4.8/crtend.o" "/usr/lib/gcc/x86_64-linux-gnu/4.8/../../../x86_64-linux-gnu/crtn.o"

-###參数是为了查看。clang driver究竟调用了哪些命令,而且不会执行这些命令。从这里能够实际看到,实际上调用的是 clang-3.5 -cc1。当中3.5是版本,所以事实上调用的就是clang编译器。

之后又调用了系统的ld loader,由于LLVM架构的loader还在开发之中。

所以,对于那些我们已经明白须要clang编译器去作的工作,我们能够不通过clang driver去隐式调用(比方上面的样例)。而是直接在命令行调用clang -cc1去执行。而且在clang -cc1之后跟clang编译器接受的參数。也能够通过clang -Xclang就能够直接将參数传递给clang编译器(clang -cc1)。以下的详细实现,将同一时候给出这两种的命令行形式,事实上执行结果差点儿是全然同样的。不同的是,使用clang -Xclang的时候,假设不加强制的參数,这里尽管-Xclang将參数传递给了clang -cc1,可是这里的clang driver依旧会继续工作的。在以下的样例中会进行分别的展示

编译器首先进行的是词法分析。我们能够通过命令行去查看进行词法分析之后的token序列究竟是怎么样的,仍然以上面的min.c为例,执行命令:

clang -cc1 -dump-tokens min.c

执行之后得到例如以下输出:

int 'int'  [StartOfLine]  Loc=<min.c:1:1>
identifier 'min'   [LeadingSpace] Loc=<min.c:1:5>
l_paren '('       Loc=<min.c:1:8>
int 'int'     Loc=<min.c:1:9>
identifier 'a'     [LeadingSpace] Loc=<min.c:1:13>
comma ','     Loc=<min.c:1:14>
int 'int'  [LeadingSpace] Loc=<min.c:1:16>
identifier 'b'     [LeadingSpace] Loc=<min.c:1:20>
r_paren ')'       Loc=<min.c:1:21>
l_brace '{'    [LeadingSpace] Loc=<min.c:1:23>
if 'if'    [StartOfLine] [LeadingSpace]   Loc=<min.c:2:5>
l_paren '('    [LeadingSpace] Loc=<min.c:2:8>
identifier 'a'        Loc=<min.c:2:9>
less '<'    [LeadingSpace] Loc=<min.c:2:11>
identifier 'b'     [LeadingSpace] Loc=<min.c:2:13>
r_paren ')'       Loc=<min.c:2:14>
l_brace '{'    [LeadingSpace] Loc=<min.c:2:16>
return 'return'    [StartOfLine] [LeadingSpace]   Loc=<min.c:3:9>
identifier 'a'     [LeadingSpace] Loc=<min.c:3:16>
semi ';'      Loc=<min.c:3:17>
r_brace '}'    [StartOfLine] [LeadingSpace]   Loc=<min.c:4:5>
return 'return'    [StartOfLine] [LeadingSpace]   Loc=<min.c:5:5>
identifier 'b'     [LeadingSpace] Loc=<min.c:5:12>
semi ';'      Loc=<min.c:5:13>
r_brace '}'    [StartOfLine]  Loc=<min.c:6:1>
eof ''        Loc=<min.c:6:2>

或者选用: clang -Xclang -dump-tokens min.c

输出信息例如以下:

int 'int'   [StartOfLine]  Loc=<min.c:1:1>
identifier 'min'   [LeadingSpace] Loc=<min.c:1:5>
l_paren '('       Loc=<min.c:1:8>
int 'int'     Loc=<min.c:1:9>
identifier 'a'     [LeadingSpace] Loc=<min.c:1:13>
comma ','     Loc=<min.c:1:14>
int 'int'  [LeadingSpace] Loc=<min.c:1:16>
identifier 'b'     [LeadingSpace] Loc=<min.c:1:20>
r_paren ')'       Loc=<min.c:1:21>
l_brace '{'    [LeadingSpace] Loc=<min.c:1:23>
if 'if'    [StartOfLine] [LeadingSpace]   Loc=<min.c:2:5>
l_paren '('    [LeadingSpace] Loc=<min.c:2:8>
identifier 'a'        Loc=<min.c:2:9>
less '<'    [LeadingSpace] Loc=<min.c:2:11>
identifier 'b'     [LeadingSpace] Loc=<min.c:2:13>
r_paren ')'       Loc=<min.c:2:14>
l_brace '{'    [LeadingSpace] Loc=<min.c:2:16>
return 'return'    [StartOfLine] [LeadingSpace]   Loc=<min.c:3:9>
identifier 'a'     [LeadingSpace] Loc=<min.c:3:16>
semi ';'      Loc=<min.c:3:17>
r_brace '}'    [StartOfLine] [LeadingSpace]   Loc=<min.c:4:5>
return 'return'    [StartOfLine] [LeadingSpace]   Loc=<min.c:5:5>
identifier 'b'     [LeadingSpace] Loc=<min.c:5:12>
semi ';'      Loc=<min.c:5:13>
r_brace '}'    [StartOfLine]  Loc=<min.c:6:1>
eof ''        Loc=<min.c:6:2>
/usr/bin/ld: cannot find /tmp/min-3cce9d.o: No such file or directory
clang-3.5: error: linker command failed with exit code 1 (use -v to see invocation)

明显能够看到,使用-Xclang的时候,把-dump-tokens參数传递给了clang -cc1,可是clang driver依旧工作,而且调用了ld.

能够使用clang -### -Xclang -dump-tokens min.c命令进行验证。

看过了词法分析阶段,我们再看下clang编译器语法分析来的AST nodes。

使用命令:clang -cc1 -fsyntax-only -ast-dump min.c

或者:clang -fsyntax-only -Xclang -ast-dump min.c

输出结果一样:

TranslationUnitDecl 0x6bc3a40 <<invalid sloc>> <invalid sloc>
|-TypedefDecl 0x6bc3f40 <<invalid sloc>> <invalid sloc> implicit __int128_t '__int128'
|-TypedefDecl 0x6bc3fa0 <<invalid sloc>> <invalid sloc> implicit __uint128_t 'unsigned __int128'
|-TypedefDecl 0x6bc42f0 <<invalid sloc>> <invalid sloc> implicit __builtin_va_list '__va_list_tag [1]'
`-FunctionDecl 0x6bc4490 <min.c:1:1, line:6:1> line:1:5 min 'int (int, int)'|-ParmVarDecl 0x6bc4350 <col:9, col:13> col:13 used a 'int'|-ParmVarDecl 0x6bc43c0 <col:16, col:20> col:20 used b 'int'`-CompoundStmt 0x6bc46f8 <col:23, line:6:1>|-IfStmt 0x6bc4668 <line:2:5, line:4:5>| |-<<<NULL>>>| |-BinaryOperator 0x6bc45c0 <line:2:9, col:13> 'int' '<'| | |-ImplicitCastExpr 0x6bc4590 <col:9> 'int' <LValueToRValue>| | | `-DeclRefExpr 0x6bc4540 <col:9> 'int' lvalue ParmVar 0x6bc4350 'a' 'int'| | `-ImplicitCastExpr 0x6bc45a8 <col:13> 'int' <LValueToRValue>| |   `-DeclRefExpr 0x6bc4568 <col:13> 'int' lvalue ParmVar 0x6bc43c0 'b' 'int'| |-CompoundStmt 0x6bc4648 <col:16, line:4:5>| | `-ReturnStmt 0x6bc4628 <line:3:9, col:16>| |   `-ImplicitCastExpr 0x6bc4610 <col:16> 'int' <LValueToRValue>| |     `-DeclRefExpr 0x6bc45e8 <col:16> 'int' lvalue ParmVar 0x6bc4350 'a' 'int'| `-<<<NULL>>>`-ReturnStmt 0x6bc46d8 <line:5:5, col:12>`-ImplicitCastExpr 0x6bc46c0 <col:12> 'int' <LValueToRValue>`-DeclRefExpr 0x6bc4698 <col:12> 'int' lvalue ParmVar 0x6bc43c0 'b' 'int'

通过clang -### -fsyntax-only -Xclang -ast-dump min.c查看实际执行命令。事实上跟使用clang -cc1是同样的。

參考资料:

1. 《Getting Started with LLVM Core Libraries》

2.  Code of clang

本文转自mfrbuaa博客园博客,原文链接:http://www.cnblogs.com/mfrbuaa/p/5138868.html,如需转载请自行联系原作者

v深入研究Clang(四) Clang编译器的简单分析相关推荐

  1. 深入研究Clang(四) Clang编译器的简单分析

    作者:史宁宁(snsn1984) 首先我们确定下Clang编译器的具体内容和涵盖范围.之前在<LLVM每日谈之二十 Everything && Clang driver > ...

  2. Windows异常学习笔记(四)—— 编译器扩展SEH

    Windows异常学习笔记(四)-- 编译器扩展SEH 要点回顾 编译器支持的SEH 过滤表达式 实验一:理解_try_except 实验二:_try_except 嵌套 拓展SEH结构体 scope ...

  3. GraphPad Prism 实例教程:剂量反应案例研究,四参数 Logistic 模型

    摘要:本篇案例分析,将利用 GraphPad Prism 8 中常见的「四参数 Logistic 回归模型」,分析来自某项剂量反应试验的数据.该试验目标是预估在有无增强剂(booster)的条件下,跳 ...

  4. clang --version clang: error while loading shared libraries: libtinfo.so.5: cannot open shared objec

    安装llvm时出现 clang --version clang: error while loading shared libraries: libtinfo.so.5: cannot open sh ...

  5. 四年级计算机期末质量分析,小学四年级科学试卷分析

    篇一:小学四年级科学上学期期末试卷分析 小学四年级科学上学期期末试卷分析 一.学生情况分析 在学习中,学生的知识与技能.情感态度价值观等方面都有一定的进步,知识的获取.方法的掌握.技能的形成以及在生活 ...

  6. 【开发环境】Ubuntu 中使用 VSCode 开发 C/C++ ④ ( 创建 tasks.json 编译器构建配置文件 | tasks.json 编译器构建配置文件分析 )

    文章目录 一.创建 tasks.json 编译器构建配置文件 二.tasks.json 编译器构建配置文件分析 可以参考官方提供的文档 : https://code.visualstudio.com/ ...

  7. MYSQL的全表扫描,主键索引(聚集索引、第一索引),非主键索引(非聚集索引、第二索引),覆盖索引四种不同查询的分析...

    文章出处:http://inter12.iteye.com/blog/1430144 MYSQL的全表扫描,主键索引(聚集索引.第一索引),非主键索引(非聚集索引.第二索引),覆盖索引四种不同查询的分 ...

  8. Day02| 第四期-阿里巴巴股票行情分析(一)

                        01    前言                    2020年高考的第一天到来了,不晓得你的心情如何,我想我们始终忘不了的是对追梦过程中的努力,希望长大以后 ...

  9. 计算机网络ieee802.3标准,计算机网络实验四IEEE 802.3协议分析和以太网

    <计算机网络实验四IEEE 802.3协议分析和以太网>由会员分享,可在线阅读,更多相关<计算机网络实验四IEEE 802.3协议分析和以太网(6页珍藏版)>请在人人文库网上搜 ...

最新文章

  1. python3基础教程廖雪峰云-学习廖雪峰Python3教程的pytho
  2. MSSQL 访问Mysql
  3. Leetcode题解(20)
  4. 基于webrtc多人音视频的研究(一)
  5. SAS宏保存以便快速调用的三种解决方案(转载)
  6. python gmm em算法 2维数据_python自学日记18——数据结构与算法(2)
  7. 【C语言】C语言的数据类型
  8. es6 Promise 的应用
  9. python时间格式化代码_Python代码中如何将”日期时间”格式化为自己所需的样式呢?...
  10. 通信工程和计算机专业与软件工程专业,从短期和长远来看,哪个专业的前景和钱景更好?
  11. Atitit.软件GUI按钮与仪表盘(01)--js区-----js格式化的使用
  12. abb机器人离线编程软件叫做_Robotstudio软件:ABB机器人机器视觉位姿引导虚拟仿真...
  13. win10创建系统还原点
  14. Unity2023 Alpha新功能简介
  15. RFT API初涉——之解决RFT无法识别windows对话框的问题
  16. 单sheet页的多个EXCEL文档合并为一个多sheet页的EXCEL文档
  17. Python函数里的爱情故事
  18. 使用eclipse遇到问题:the-package-collides-with-a-type
  19. Google Earth Engine(GEE)——GEE最全介绍(7000字长文)初学者福音!
  20. 海上风电场对雷达性能的影响——雷达回波

热门文章

  1. 微软白皮书:47页报告详解中国芯片设计云技术
  2. 国产半导体路在何方,瓦森纳与光刻机你了解多少
  3. 李德毅院士:未来交通——自动驾驶与智能网联
  4. 智能连接:5G与人工智能、物联网等技术的超级融合
  5. 也谈压缩感知和贝叶斯大脑
  6. 最后期限已至,高通收购恩智浦全剧终!中国一刀切断高通物联网全局梦!
  7. 著名物理学家斯蒂芬•霍金去世,他曾告诫人类要学会避免人工智能可能的风险
  8. 2018 年人工智能会怎么发展?这里有 8 个预测
  9. 这几家公司有个梦想:开发AI操作系统,让外行也成为人工智能大师
  10. AI在行动:改变科学界的人工智能