c++如何实现一个简单的AST解释器_c++编译原理入门项目【源码】

12次阅读

c++ AST解释器通过三步实现:词法分析(隐式跳过空格)、递归下降语法分析(parseExpr/parseTerm/parseFactor处理优先级)、虚函数AST求值,支持整数、四则运算和括号,代码精简可运行。

c++如何实现一个简单的AST解释器_c++编译原理入门项目【源码】

用 C++ 实现一个简单的 AST 解释器,核心是三步:词法分析(Tokenizer)→ 语法分析(Parser,生成 AST)→ 解释执行(Evaluator)。下面是一个可运行的入门级实现,支持加减乘除、括号和整数,代码精简、结构清晰,适合编译原理初学者理解流程。

1. 定义 AST 节点类型

先设计抽象语法树的节点基类和具体表达式节点,用 std::variant 或虚函数均可;这里采用虚函数 + 继承,更直观易懂:

// ast.hpp #include  #include  #include  

struct Astnode { virtual ~AstNode() = default; virtual int eval() const = 0; };

struct NumberNode : AstNode { int value; NumberNode(int v) : value(v) {} int eval() const override { return value; } };

struct BinaryOpNode : AstNode { char op; std::unique_ptr left; std::unique_ptr right; BinaryOpNode(char o, std::unique_ptr l, std::unique_ptr r) : op(o), left(std::move(l)), right(std::move(r)) {} int eval() const override { int l = left->eval(); int r = right->eval(); switch (op) { case '+': return l + r; case '-': return l - r; case '': return l r; case '/': return r != 0 ? l / r : throw std::runtime_error("div by zero"); default: throw std::runtime_error("unknown op"); } } };

2. 手写递归下降 Parser(生成 AST)

不依赖外部库,用字符串索引+递归下降实现。支持优先级:乘除 > 加减 > 括号。关键技巧是提取 parseExpr(处理 +−)、parseTerm(处理 *⁄)、parseFactor(处理数字/括号):

// parser.hpp #include  #include  #include "ast.hpp" 

class Parser { std::String input; size_t pos = 0;

void skipSpace() {     while (pos < input.size() && isspace(input[pos])) ++pos; }  int parseNumber() {     skipSpace();     int start = pos;     while (pos < input.size() && isdigit(input[pos])) ++pos;     if (start == pos) throw std::runtime_error("expected number");     return std::stoi(input.substr(start, pos - start)); }  std::unique_ptr parseFactor() {     skipSpace();     if (pos < input.size() && input[pos] == '(') {         ++pos; // '('         auto expr = parseExpr();         skipSpace();         if (pos < input.size() && input[pos] == ')') ++pos;         else throw std::runtime_error("expected ')'");         return expr;     }     return std::make_unique(parseNumber()); }  std::unique_ptr parseTerm() {     auto left = parseFactor();     while (true) {         skipSpace();         if (pos < input.size() && (input[pos] == '*' || input[pos] == '/')) {             char op = input[pos++];             auto right = parseFactor();             left = std::make_unique(op, std::move(left), std::move(right));         } else break;     }     return left; }  std::unique_ptr parseExpr() {     auto left = parseTerm();     while (true) {         skipSpace();         if (pos < input.size() && (input[pos] == '+' || input[pos] == '-')) {             char op = input[pos++];             auto right = parseTerm();             left = std::make_unique(op, std::move(left), std::move(right));         } else break;     }     return left; }

public: Parser(const std::string& s) : input(s) {} std::unique_ptr parse() { return parseExpr(); } };

3. 主程序:读取、解析、求值

一行输入,一次解析,一次求值。加入基础错误处理,便于调试:

立即学习C++免费学习笔记(深入)”;

// main.cpp #include  #include  #include "parser.hpp" 

int main() { std::string line; std::cout << "AST Interpreter (enter 'quit' to exit):n"; while (std::getline(std::cin, line)) { if (line == "quit") break; try { Parser p(line); auto ast = p.parse(); std::cout << "= " << ast->eval() << "n"; } catch (const std::exception& e) { std::cerr << "Error: " << e.what() << "n"; } } return 0; }

4. 编译与运行

使用 C++17 或更新标准(需 std::unique_ptr 和 structured binding 支持):

  • 保存为 ast.hppparser.hppmain.cpp
  • 编译命令:g++ -std=c++17 -o calc main.cpp
  • 运行:./calc,然后输入如 3 + 4 * 2 → 输出 = 11

这个解释器虽小,但已覆盖编译前端核心环节:Token 不显式建结构(简化版“隐式 token”),Parser 是纯手工递归下降,AST 节点可轻松扩展(比如加变量、赋值、if)。下一步可引入符号表支持变量,或改造成字节码生成器——本质上就是编译器的雏形。

基本上就这些。不复杂但容易忽略细节,比如运算符优先级顺序、括号匹配、空格跳过和错误位置提示。把 parser 的每个函数对应到语法产生式(如 Expr → Term { (+|−) Term }),你就真正跨进编译原理的门了。

text=ZqhQzanResources