文章目录

ANTLR 实战 SQL 词法/语法分析

一、准备工具

二、实战环节

1. 方式1:不借助外部 IDE

2. 方式2:借助 idea

参考资料

ANTLR 实战 SQL 词法/语法分析

关于 词法/语法分析 和 ANTLR 语法 的详细内容,可参考我的另一篇博客:https://blog.csdn.net/pentiumCM/article/details/106076655。

本篇博客为实战入门速食篇,主要提供demo实战,不做太多内容展开。

ANTLR 是语言识别的一个工具 (ANother Tool for Language Recognition ) ,它提供了一个框架,可以通过包含 Java, C++, 或 C# 动作(action)的语法描述来构造语言识别器,编译器和解释器。

一、准备工具

安装 ANTLR 环境:

推荐使用 ANTLR-4.8版本

参考资料:https://www.cnblogs.com/wynjauu/articles/9872822.html

本篇博客主要介绍在 java 环境下面使用 ANTLR,所有有两种方式:

方式一:直接基于 java 的 jdk 环境,不使用 java的 IDE中来使用 ANTLR,全程操作在CMD中通过命令

方式二:基于 java 的 IDE 来使用 ANTLR,操作比较方便

两种方式皆可,如果电脑中有 ide 编译器,本人建议可使用 ide 安装 ANTLR 的插件来使用 ANTLR。

二、实战环节

1. 方式1:不借助外部 IDE

准备 ANTLR 的 文法文件(g4后缀)

可以从 ANTLR 官方提供的 demo 中挑选自己需要的,ANTLR 官方demo:https://github.com/antlr/grammars-v4

为了方便,我直接贴出我已经选好的文法,如下:

MysqlQuery.g4:

MysqlQuery.g4 内容如下:

// 1. 定义一个名为 MysqlQuery 的语法

grammar MysqlQuery;

// 2. rule - 这是核心,表示规则,以 “:” 开始, “;” 结束, 多规则以 "|" 分隔。

// 2.1 lexer - 词法(符号(Token)名大写开头 - 词法)

AS : A S;

SELECT : S E L E C T;

FROM : F R O M;

TABLE : T A B L E;

MAX : M A X;

SUM : S U M;

AVG : A V G;

MIN : M I N;

COUNT : C O U N T;

ALL : A L L;

DISTINCT : D I S T I N C T;

WHERE : W H E R E;

GROUP : G R O U P;

BY : B Y ;

ORDER : O R D E R;

HAVING : H A V I N G;

NOT : N O T;

IS : I S ;

TRUE : T R U E;

FALSE : F A L S E;

UNKNOWN : U N K N O W N;

BETWEEN : B E T W E E N;

AND : A N D;

IN : I N;

NULL : N U L L;

OR : O R ;

ASC : A S C;

DESC : D E S C;

LIMIT : L I M I T ;

OFFSET : O F F S E T;

fragment A : [aA];

fragment B : [bB];

fragment C : [cC];

fragment D : [dD];

fragment E : [eE];

fragment F : [fF];

fragment G : [gG];

fragment H : [hH];

fragment I : [iI];

fragment J : [jJ];

fragment K : [kK];

fragment L : [lL];

fragment M : [mM];

fragment N : [nN];

fragment O : [oO];

fragment P : [pP];

fragment Q : [qQ];

fragment R : [rR];

fragment S : [sS];

fragment T : [tT];

fragment U : [uU];

fragment V : [vV];

fragment W : [wW];

fragment X : [xX];

fragment Y : [yY];

fragment Z : [zZ];

fragment HEX_DIGIT: [0-9A-F];

fragment DEC_DIGIT: [0-9];

fragment LETTER: [a-zA-Z];

ID: ( 'A'..'Z' | 'a'..'z' | '_' | '$') ( 'A'..'Z' | 'a'..'z' | '_' | '$' | '0'..'9' )*;

TEXT_STRING : ( '\'' ( ('\\' '\\') | ('\'' '\'') | ('\\' '\'') | ~('\'') )* '\'' );

ID_LITERAL: '*'|('@'|'_'|LETTER)(LETTER|DEC_DIGIT|'_')*;

REVERSE_QUOTE_ID : '`' ~'`'+ '`';

DECIMAL_LITERAL: DEC_DIGIT+;

// 2.2 parser - 语法

//解析规则(Parser rule)名小写开头,后面可以跟字母、数字、下划线 - 语法

tableName : tmpName=ID;

column_name :ID;

function_name : tmpName=ID ;

selectStatement:

SELECT

selectElements

(

FROM tableSources

( whereClause )?

( groupByCaluse )?

( havingCaluse )?

) ?

( orderByClause )?

( limitClause )?

;

selectElements

: (star='*' | selectElement ) (',' selectElement)*

;

tableSources

: tableName (',' tableName)*

;

whereClause

: WHERE logicExpression

;

logicExpression

: logicExpression logicalOperator logicExpression

| fullColumnName comparisonOperator value

| fullColumnName BETWEEN value AND value

| fullColumnName NOT? IN '(' value (',' value)* ')'

| '(' logicExpression ')'

;

groupByCaluse

: GROUP BY groupByItem (',' groupByItem)*

;

havingCaluse

: HAVING logicExpression

;

orderByClause

: ORDER BY orderByExpression (',' orderByExpression)*

;

limitClause

: LIMIT

(

(offset=decimalLiteral ',')? limit=decimalLiteral

| limit=decimalLiteral OFFSET offset=decimalLiteral

)

;

orderByExpression

: fullColumnName order=(ASC | DESC)?

;

groupByItem

: fullColumnName order=(ASC | DESC)?

;

logicalOperator

: AND | '&' '&' | OR | '|' '|'

;

comparisonOperator

: '=' | '>' | ' | ' '=' | '>' '='

| ' '>' | '!' '=' | ' '=' '>'

;

value

: uid

| textLiteral

| decimalLiteral

;

decimalLiteral

: DECIMAL_LITERAL

;

textLiteral

: TEXT_STRING

;

selectElement

: fullColumnName (AS? uid)? #selectColumnElement

| functionCall (AS? uid)? #selectFunctionElement

;

fullColumnName

: column_name

;

functionCall

: aggregateWindowedFunction #aggregateFunctionCall

;

aggregateWindowedFunction

: (AVG | MAX | MIN | SUM) '(' functionArg ')'

| COUNT '(' (starArg='*' | functionArg?) ')'

| COUNT '(' aggregator=DISTINCT functionArgs ')'

;

functionArg

: column_name

;

functionArgs

: column_name (',' column_name)*

;

uid

: ID

;

// 在进行解析的过程中,忽略掉空格,换行

WS : [ \t\r\n]+ -> skip ; // skip spaces, tabs, newlines

运行命令生成相关java文件与token文件:

在 文件MysqlQuery.g4 所在的目录打开CMD窗口,执行如下的命令:

antlr4 MysqlQuery.g4

如图,箭头1是我们自己定义好的 词法/语法 规则,箭头2是 antlr4 生成命令,箭头3是生成出来的文件。

编译java文件

继续在 cmd 窗口中执行命令:

javac ./*.java

分析语法树

输入grun命令回车,在命令行输入你要测试的语法,再回车,按Ctrl+z 后回车。

例如,我们需要测试 MysqlQuery.g4 文件中的 selectStatement:

我们在当前的 CMD中输入:

grun MysqlQuery selectStatement -gui

回车之后,即可输入我们需要测试的语句,这时候我们输入:

select a from b where c = 1

继续回车,这时候按 Ctrl+z(结束符)后再按回车,便可得到我们需要的语法树了,并且以 GUI 的形式呈现:

语法树的 GUI 窗口:

2. 方式2:借助 idea

IDEA 集成 ANTLR:

参考资料: https://blog.csdn.net/qq_21383435/article/details/80814618

在 idea 中新建 maven 项目,在项目中新建 .g4 的文法文件

MysqlQuery.g4 文件内容为方案一中所提供的内容

文法可视化

在 idea 中集成使用 ANTLR 的好处是,当你编辑好 .g4的文法文件之后,不需要像方案一中生成 java 等文件在编译 进行测试,直接可以通过 ANTLR Preview进行查看效果。

在 ide 中调出 ANTLR Preview:

在 .g4 的文法文件中选择需要测试的语法:

如我们需要测试 selectStatement,鼠标点到该语法处,然后右键 Text Rule selectStatement

在左侧输入待测试的序列,右侧会自动生成语法树结构,十分方便

参考资料

https://blog.csdn.net/qq_39158142/article/details/86437919

https://blog.csdn.net/sherrywong1220/article/details/53697737?utm_source=blogxgwz4

mysql词法分析antlr4_ANTLR 实战 SQL 词法/语法分析相关推荐

  1. mysql词法分析antlr4_sharding-jdbc之ANTLR4 SQL解析

    公众号:帽爹的技术轮子 Sharding主要利用ANTLR4来解析SQL,以mysql为例,分析源码前可以先了解以下三点: 源码分析 1.解析入口ParsingSQLRouter#parse /** ...

  2. Mysql增删改查|SQL语句(史上最全|实战教学)

    文章目录 关于数据库的操作 1.查看数据库 2.创建数据库 3.选择要操作的数据库 4.查看自己所处的位置及默认所在的位置 5.在命令行选择默认的数据库 6.删除数据库 关于表的操作 1. 查看库有哪 ...

  3. mysql 查询执行过程_深入浅出Mysql(一)——sql查询执行过程

    一.sql查询执行过程概括 下面给出的mysql基本架构示意图,从中你可以清楚的mysql的各个模块和执行过程. 大体来说可以分为两部分Server层和储存引擎层.Server层包括连接器.查询缓存. ...

  4. MySQL系列---架构与SQL执行流程详解

    文章目录 1. 背景 2. 架构体系 2.1 架构图 2.2 模块详解 2.3 架构分层 3. 查询SQL语句执行流程 3.1 连接 3.1.1 MySQL支持的通信协议 3.1.2 通信方式 3.2 ...

  5. 【MySQL专题】MySQL中一条SQL是如何被执行的?---来自于令狐的独孤九剑

    [MySQL专题]MySQL中一条SQL是如何被执行的? 前言 ​ 大家好,我是令狐,欢迎来到令狐的独孤九剑**[MySQL专题]**这节课跟大家聊一聊MySQL中一条SQL是如何被执行的. MySQ ...

  6. 【MySQL之MySQL底层分析篇】系统学习MySQL,从应用SQL语法到底层知识讲解,这将是你见过最完成的知识体系

    文章目录 MySQL体系结构 MySQL存储结构(以InnoDB为例) MySQL执行流程(以InnoDB为例) 1. 数据写入原理 2. 数据查询原理 MySQL存储引擎 1. 为什么需要不同的存储 ...

  7. 开发人员MySQL调优-实战篇2-让SQL使用索引详解

    2019独角兽企业重金招聘Python工程师标准>>> 建议先看看开发人员MySQL调优-实战篇0 让执行的SQL使用索引 虽然DBA给我们建了很多索引,但没有经验的开发人员往往只看 ...

  8. 收藏起来,史上最全的 MySQL 高性能优化实战总结!

    一.前言 MySQL 对于很多 Linux 从业者而言,是一个非常棘手的问题,多数情况都是因为对数据库出现问题的情况和处理思路不清晰.在进行 MySQL 的优化之前必须要了解的就是 MySQL 的查询 ...

  9. MySQL高性能优化实战总结!

    1.1 前言 MySQL对于很多Linux从业者而言,是一个非常棘手的问题,多数情况都是因为对数据库出现问题的情况和处理思路不清晰.在进行MySQL的优化之前必须要了解的就是MySQL的查询过程,很多 ...

最新文章

  1. MonoRail学习笔记一:一个小例子
  2. 【Android 应用开发】Activity 任务亲和性 taskAffinity 设置 ( taskAffinity 属性 )
  3. 卫生统计学v是什么意思_四川大学华西公共卫生学院报考常见问题答疑
  4. 用python输出12和8的最大公_重点汇总-python常见问题1
  5. 翻译:程序员数据结构基础:选择正确的数据结构
  6. 《天天数学》连载09:一月九日
  7. careercup-数学与概率 7.7
  8. Delphi窗体显示Echarts图表
  9. 关于JSON的那些事儿
  10. keras+tensorflow —— 可视化及tensorboard
  11. MVC案例之DAO层设计
  12. 北大中文核心期刊计算机类前30%名录
  13. Vue源码笔记之项目架构
  14. 3.12_ValueError: x and y must have same first dimension, but have shapes (100,) and (1,)
  15. 写给朋友们的Markdown教程,真的很好用,而且很简单
  16. ZZULIOJ:1035: 分段函数求值
  17. 关于SpringMVC中使用LocalDateTime类型接收参数提示类型不匹配的问题
  18. Python silk 库 支持微信语音
  19. html 禁止触摸事件,html5的触摸事件
  20. OpenDlight MD-SAl应用开发(二)- ODL源码编译运行

热门文章

  1. java顺丰运费接口_对接顺丰丰桥踩坑汇总(写给自己)
  2. 中国红十字救护员培训 —— 沈阳市红十字会救护员培训
  3. 在Linux操作系统内安装PacketiX ×××的步骤
  4. Python设计KNN算法实现对空气质量的预测
  5. 关于BI(4)-企业如何提高“数据文化水平”
  6. 发送邮件:SpringBoot+阿里云服务器+解决25端口禁用问题
  7. CATIA.P3.V5-6.R2014 / DS CATIA P3 V5-6R2014 GA (SP1) with Documentation
  8. 系统服务器表单如很删除,如何删除系统默认打印机表格?
  9. 用Python 画雪花
  10. 【瑞吉外卖】学习笔记-day6:(一)导入用户地址簿相关功能及菜品展示