ANTLR4入门【打造你自己的语法规则】

java路飞

8335人浏览 · 2023-03-22 23:08:17

java路飞 · 2023-03-22 23:08:17 发布

文章目录

什么是ANTLR4
ANTLR4的特点
ANTLR4的语法规则
如何使用ANTLR4
实战

什么是ANTLR4

ANTLR4（全称为"ANother Tool for Language Recognition"）是一种用于构建语言识别器的强大工具。它是一个自动生成的解析器生成器，使用ANTLR4可以帮助开发人员快速创建自定义的语言或DSL。

ANTLR4的特点

支持多种目标语言，包括Java、C#、Python、JavaScript等。
支持LL(*)（LL star）语法分析器，可以处理包含任意数目的向前看标记（lookahead）的语法。
支持词法和语法错误处理，可以生成清晰的错误消息和恢复策略。
支持生成AST（抽象语法树），方便语言处理器进行语法分析和代码生成。
提供了丰富的API和工具集，可以自定义和优化ANTLR4生成的解析器。

ANTLR4的语法规则

语法规则的声明

ANTLR4的语法规则必须以“grammar”关键字开始，后面跟着语法规则的名称。例如：

grammar MyGrammar;

这里声明了一个名为"MyGrammar"的语法规则。

.g4文件的代码规则

词法规则

ANTLR4语法规则以词法规则（lexer rules）开始。词法规则定义了输入文本中的各个单词（或标记），这些单词将被语法规则使用。每个词法规则定义一个单词的名称和匹配该单词的正则表达式。

以下是一个简单的例子：

// 定义变量名为一个字母后跟零个或多个字母、数字或下划线
ID : [a-zA-Z] [a-zA-Z0-9_]*;

在这个例子中，我们定义了一个名为ID的词法规则，该规则匹配一个以字母开头，后跟零个或多个字母、数字或下划线的字符串。在语法规则中，我们可以使用ID来匹配变量名。

语法规则

ANTLR4语法规则定义了输入文本的结构。语法规则由词法规则和其他语法规则组成，定义了输入文本的结构。语法规则通常以一个称为start的语法规则开始，这个语法规则定义了整个输入文本的结构。

以下是一个简单的例子：

// 定义一个简单的算术表达式语法规则
expr : INT
     | expr op=('*' | '/') expr
     | expr op=('+' | '-') expr
     | '(' expr ')'
     ;

INT : [0-9]+;

在这个例子中，我们定义了一个名为expr的语法规则，该规则定义了一个简单的算术表达式。该规则由四个子规则组成，每个子规则定义了一种表达式。第一个子规则匹配整数，第二个和第三个子规则匹配乘法、除法、加法和减法，最后一个子规则匹配括号中的表达式。我们还定义了一个名为INT的词法规则，该规则匹配一个或多个数字。在这个例子中，我们使用INT来匹配整数。

语法规则中的操作

// 定义一个带有语义谓词的语法规则
expr : INT { $INT.text.equals("0")}

在这个例子中，我们定义了一个名为expr的语法规则，该规则匹配整数，并使用语义谓词来指定该规则是否适用于输入文本。在这个例子中，语义谓词检查整数是否为零。

如何使用ANTLR4

下载并安装ANTLR4：只需要下载官方网站上提供的ANTLR4 JAR文件，然后将其添加到您的Java类路径中即可。您还可以选择安装ANTLR4插件来集成到您的IDE中，以便更方便地使用ANTLR4。下面我们演示如何在IDEA中使用ANTLR4插件。
编写语法文件：在ANTLR4中，您需要编写一个.g4文件来定义词法和语法规则。您可以使用文本编辑器编写.g4文件。
生成代码：一旦您编写了.g4文件，您可以使用ANTLR4生成Java代码。使用以下命令可以生成Java代码：

java -jar antlr-4.9.2-complete.jar YourGrammar.g4

在上面的命令中，您需要将YourGrammar.g4替换为您的.g4文件的名称。

编写解析器：一旦您生成了Java代码，您可以编写一个Java解析器来解析输入文本。您可以使用ANTLR4提供的Java API来编写解析器。

CharStream input = CharStreams.fromStream(System.in);
YourGrammarLexer lexer = new YourGrammarLexer(input);
CommonTokenStream tokens = new CommonTokenStream(lexer);
YourGrammarParser parser = new YourGrammarParser(tokens);
YourGrammarParser.StartContext tree = parser.start();

在上面的代码中，您需要将YourGrammarLexer和YourGrammarParser替换为您生成的Lexer和Parser类的名称。您还需要替换start()方法，该方法应该返回您的语法规则中的start规则的ParseTree对象。

实战

我们来做一个具体的例子，经典的计算器，主要是实现四则运算，带括号等等。

IDEA安装ANTLR插件

File->Settings->Plugins->Marketplace
在这里插入图片描述

新建项目

新建一个maven项目
在这里插入图片描述
pom.xml引入antlr的依赖

            <dependency>
                <groupId>org.antlr</groupId>
                <artifactId>antlr4-runtime</artifactId>
                <version>4.10.1</version>
            </dependency>

创建一个.g4文件

在这里插入图片描述

grammar Arithmetic;

/*
 * Parser rules
 */

parse
    : expr EOF
    ;

expr
    : term (('+'|'-') term)*
    ;

term
    : factor (('*'|'/') factor)*
    ;

factor
    : NUMBER
    | '(' expr ')'
    ;

/*
 * Lexer rules
 */

NUMBER
    : DIGIT+ ('.' DIGIT+)?
    ;

DIGIT
    : [0-9]
    ;

WHITESPACE
    : [ \t\n\r] -> skip
    ;

在这个语法规则中，我们定义了四个规则：

parse：最高级别的规则，表示一个完整的表达式。它由一个expr规则后面跟着一个EOF标记组成。
expr：表示一个加法或减法表达式。它由一个term规则后面跟着零个或多个加法或减法符号，后面再跟着一个term规则组成。
term：表示一个乘法或除法表达式。它由一个factor规则后面跟着零个或多个乘法或除法符号，后面再跟着一个factor规则组成。
factor：表示一个数字或括号内的表达式。它可以是一个数字，或者是一个由左括号、一个表达式和右括号组成的组合。

注意，在这个示例中，我们还定义了一些Lexer规则，用于识别数字和忽略空格和换行符。

我们可以通过idea的antlr插件来检查我们的语法规则：
如下图，点击ANTLR Preview可以来到如下界面。左边的框填写需要校验的表达式，右边就是语法树解析的结果。
在这里插入图片描述
接下来，我们需要使用ANTLR来生成Java代码。

通过插件生成java代码

右键.g4文件，选择Configure ANTLR,配置java文件的生成路径。
在这里插入图片描述

再次右键.g4文件，选择Generate ANTLR Reconizer 即可生成java代码
在这里插入图片描述

创建一个EvalVisitor遍历AST

我们创建一个EvalVisitor遍历AST，并计算表达式的值。最终，我们打印计算结果。
EvalVisitor是一个我们需要自己实现的类，它继承了ArithmeticBaseVisitor，并重写了其中的方法。下面是一个简单的实现示例：
新建类EvalVisitor.java

public class EvalVisitor  extends ArithmeticBaseVisitor<Double> {
    // 使用一个Map来存储变量名和值的映射关系
    Map<String, Double> memory = new HashMap<String, Double>();


    // 重写visitExpr方法，用于计算加法和减法
    @Override
    public Double visitExpr(ArithmeticParser.ExprContext ctx) {
        Double result = visit(ctx.term(0));
        for (int i = 1; i < ctx.term().size(); i++) {
            String op = ctx.getChild(2*i - 1).getText();
            Double term = visit(ctx.term(i));
            if (op.equals("+")) {
                result += term;
            } else {
                result -= term;
            }
        }
        return result;
    }

    // 重写visitTerm方法，用于计算乘法和除法
    @Override
    public Double visitTerm(ArithmeticParser.TermContext ctx) {
        Double result = visit(ctx.factor(0));
        for (int i = 1; i < ctx.factor().size(); i++) {
            String op = ctx.getChild(2*i - 1).getText();
            Double factor = visit(ctx.factor(i));
            if (op.equals("*")) {
                result *= factor;
            } else {
                result /= factor;
            }
        }
        return result;
    }

    // 重写visitFactor方法，用于计算数字和括号内的表达式
    @Override
    public Double visitFactor(ArithmeticParser.FactorContext ctx) {
        if (ctx.NUMBER() != null) {
            // 如果是一个数字，直接返回其值
            return Double.parseDouble(ctx.NUMBER().getText());
        } else {
            // 如果是括号内的表达式，递归调用visit方法
            return visit(ctx.expr());
        }
    }
}

测试

新建测试类Test.java

public class Test {

        public static void main(String[] args) throws Exception {
            String input = "(1+2)*3-4";
            // 创建一个词法分析器，用于将输入转换为标记
            ArithmeticLexer lexer = new ArithmeticLexer(CharStreams.fromString(input));

            // 创建一个标记流，用于将标记传递给解析
            CommonTokenStream tokens = new CommonTokenStream(lexer);

            // 创建一个解析器，用于将标记转换为AST
            ArithmeticParser parser = new ArithmeticParser(tokens);

            // 调用解析器的parse方法，生成AST
            ParseTree tree = parser.parse();

            // 创建一个AST遍历器，用于计算表达式的值
            EvalVisitor eval = new EvalVisitor();

            // 遍历AST，并计算表达式的值
            double result = eval.visit(tree);

            // 打印计算结果
            System.out.println(result);
    }

}

测试(1+2)*3-4结果如图：
在这里插入图片描述

GitCode 开源社区

旨在为数千万中国开发者提供一个无缝且高效的云端环境，以支持学习、使用和贡献开源项目。

更多推荐

[转载]在Windows环境下安装GNU Radio

转自：在Windows环境下安装GNURadio_恐弱智_新浪博客GNU Radio是用Python开发的，大部分开源的工程能够在Linux环境下运行良好，而Windows下却运行的很勉强，而且安装配置都很复杂。GNU Radio算是个例外了，不光提供了Windows的二进制安装，还有比较详细的说明。我是Python小白，所以折腾了好久才弄好，特意记录下来，免得以后再装还折腾。GNU Radio的

GitCode 开源社区

centOS 8 使用dnf安装Docker

DNF是什么？CentOS 8使用YUM软件包管理器版本v4.0.4。现在，该版本使用DNF(已删除YUM)。DNF是软件包管理器。它会在Linux发行版上安装，执行更新并删除软件包。使用DNF安装Docker跳过具有损坏依赖性的程序包一个有效的解决方案是使您的CentOS 8系统使用以下--nobest命令安装最符合条件的版本：sudo dnf install docker...

GitCode 开源社区

定时同步数据库表(mysql+linux+crontab)

sync.sh里面的参数需要改变，ip/username/password/database/tablesync.sh#!/bin/sh# Please change the IP and password of the data source db.# Then change the table name.filename=/home/nington/db/$(date +%Y-%m