语义分析

Posted Apr 7, 2026 Updated Apr 7, 2026

By 何翌闻

10 min read

语义分析

语义分析需要做两件事情：

类型检查 — 静动(when)强弱(how serious) 【在这里不涉及】
符号检查 — 符号：变量名、函数名、类型名、标签名…

常见错误：

用到了变量/函数，但是前面没有定义【为什么不在语法分析处理？—上下文相关！】
把变量当作函数去用
重复定义

SDD和SDT

语法制导定义**SDD **(Syntax-Directed Definition) 是一个上下文无关文法（CFG）和属性（Attribute）及规则（Rule）的结合。

每个文法符号（终结符或非终结符）都关联一组属性。
每个产生式 $A \to \alpha$ 都关联一组语义规则，用于计算该产生式中符号的属性值。
核心特征
- 非过程性 (Declarative)：它只规定了属性之间“等于什么”，而不规定计算这些属性的具体先后顺序（只要满足依赖关系即可）。
- 属性分类：
  - 综合属性 (Synthesized Attribute)：在产生式 $A \to \alpha$ 中，非终结符 $A$ 的属性值是通过其子节点（即 $\alpha$ 中的符号）的属性值计算出来的。
  - 继承属性 (Inherited Attribute)：在产生式 $A \to \alpha$ 中，$\alpha$ 中某个符号的属性值是通过其父节点 $A$ 或其兄弟节点的属性值计算出来的。

语法制导翻译SDT (Syntax-Directed Translation) 是在其产生式体中嵌入了程序片段（称为语义动作，Semantic Actions）的上下文无关文法。

语义动作通常用花括号 { } 括起来。
动作可以出现在产生式体的任何位置。
核心特征
- 过程性 (Procedural)：它显式地规定了动作执行的时机。
- 实现机制：在语法分析过程中，每当分析器扫描到动作所在的位置时，就立即执行该代码片段。
- 位置敏感性：
  - 后缀 SDT：所有动作都在产生式末尾。这在自底向上（LR）分析中非常容易实现。
  - 中间动作：动作在产生式中间，通常用于自顶向下（LL）分析，用来向子树传递继承属性。

SDD是一种更高级、更抽象的说明书，它关心“结果是什么”；而SDT是在SDD的基础上增加了执行顺序，它将具体的语义动作（代码）嵌入到产生式中。

我们来举一个🌰

SDD阶段：建立逻辑

产生式	语义规则 (Semantic Rules)
$E \to E_1 + T$	$E.code = E_1.code \parallel T.code \parallel ‘+’$
$E \to T$	$E.code = T.code$
$T \to \text{digit}$	$T.code = \text{digit.lexval}$

注：$\parallel$ 表示字符串拼接。

SDT阶段：规定时机

为了实现上面的 SDD，我们需要决定什么时候执行 print。因为逆波兰式的操作符是在操作数之后的，所以这是一个后缀 SDT（动作放在产生式最后）。

$E \to E_1 + T \quad { \text{print(‘+’);} }$
$E \to T$
$T \to \text{digit} \quad { \text{print(digit.lexval);} }$

SDD是对上下文无关文法的推广

SDD = 上下文无关文法 + 属性 + 语义规则

CFG 解决了“长什么样”的问题，而 SDD 通过增加属性和规则，解决了“代表什么意思”以及“值怎么传递”的问题。

主要就是为CFG中的文法符号设置语义属性，具体来说，主要就是将一些语义属性附加到代表语言构造的文法符号上，从而把信息和语言构造联系起来

综合属性和继承属性

综合属性

在产生式 $A \to X_1X_2…X_n$ 中，如果 $A$ 的属性值是由其子节点（即右边的 $X_i$）的属性值计算出来的，那么这个属性就是综合属性。

核心特征

自底向上：信息从叶子节点逐层向上汇聚到根节点。
独立性：计算 $A$ 的属性时，只需要看它的子树，不需要管它的父节点或兄弟节点。
对应分析：它与 自底向上（LR）分析 完美契合。当一个产生式被“归约”时，我们正好拿到了所有子节点的属性，顺手就能算出父节点的属性。

继承属性

在产生式 $A \to X_1X_2…X_n$ 中，如果某个符号 $X_i$ 的属性值是由其父节点 $A$ 或者其兄弟节点 $X_j$ 的属性值计算出来的，那么这个属性就是继承属性。

核心特征

自顶向下或横向：信息从上方或侧方传来。
环境依赖：它用来传递“背景信息”或“上下文”。
对应分析：它通常出现在 自顶向下（LL）分析 中，或者在处理递归下降时用来向子函数传递参数。

维度	综合属性 (Synthesized)	继承属性 (Inherited)
信息源	来自子节点 (Children)	来自父节点 (Parent) 或兄弟 (Siblings)
直观感受	总结/结果（算完了往上传）	约束/环境（接到了指令往后传）
典型用途	表达式求值、语法树构建	类型检查、符号表定义、处理左递归
文法分类	S-属性文法 (只含综合属性)	L-属性文法 (含综合且继承受限)

终结符只有综合属性，没有继承属性，因为终结符是信息的产生者，而非接收者

注释语法分析树和依赖图

依赖图是一个有向图，用于表示语法分析树中各个属性实例之间的相互依赖关系。

节点：语法树中每个符号的每一个属性。
有向边：如果属性 $B$ 的值是由属性 $A$ 计算出来的（即语义规则中 $B = f(A, …)$），则存在一条从 $A$ 到 $B$ 的有向边（$A \to B$）。

抽象语法树与类型

具象语法树（Concrete Syntax Tree）：按照文法规则推导得到的完整树，精确反映文法的层次结构

特点：包含所有非终结符与终结符；结构冗余，贴近文法；强调推导过程

抽象语法树（ Abstract Syntax Tree ）：去除了文法中冗余的语法细节，只保留与程序语义相关的核心结构

特点：节点表示语言的核心成分（如“加法”“变量”）；忽略不必要的非终结符（如括号层次、文法辅助符号）；更接近于编译器内部的中间表示。

在编译器中，AST 是后续语义分析、优化和代码生成的核心输入

构造抽象语法树的SDD

🌰： a - 4 + c

另一个🌰：

符号表 Symbol Table

定义：符号表是用于保存各种符号相关信息的数据结构

可以利用哈希表、红黑树、链表等实现

领域特定语言DSL通常只有单作用域（全局作用域）；

但是通用程序设计语言GPL通常需要嵌套作用域，那这里用一个哈希表就不够用了，我们用多个哈希表，最终呈现一个树状结构

三种作用域：全局作用域、函数/方法作用域、局部作用域

  
public interface Scope {
    public String getName(); // 有名称吗？
    public Scope getEnclosingScope(); // 有外部作用域吗？
    public void define(Symbol sym); // 在作用域中定义符号
    public Symbol resolve(String name); // 根据名称查找
}

编译原理

笔记

This post is licensed under CC BY 4.0 by the author.

SDD和SDT

我们来举一个🌰

SDD阶段：建立逻辑

SDT阶段：规定时机

SDD是对上下文无关文法的推广

综合属性和继承属性

综合属性

核心特征

继承属性

核心特征

注释语法分析树和依赖图

抽象语法树与类型

构造抽象语法树的SDD

符号表 Symbol Table

Trending Tags