编写自己的（玩具）编程语言

本文将记录一个小型的玩具语言开发过程。作为学习实践 Rust 的副产品。

本过程将覆盖下面一些要点：

解析文本格式的源代码。
构建 AST（语法树）。
从语法树翻译为可执行的目标代码。
执行目标代码（作为验证）。

flowchart LR
    A[文本源代码] -->B[AST语法树]
    B-->C[可执行目标代码]
    C-->D["通用运行时中执行"]

另外，也可能尝试改变为解释执行。

flowchart LR
    A[文本源代码] -->B[AST语法树]
    B-->D["定制解释器中执行"]

语言设计目标

第一阶段。语法非常简单，只要实现简单的算术表达式，类似于下面。

1 + 2
1 + 2 - 3

第二阶段，实现变量。

let a = 2
let b = a + 2
b

第三阶段，实现简单的控制流。

let a = 0
let b = 0
if (a > 0) b = a + 2
b

第三阶段，实现函数。

fn add(a) {
    if (a == 1) return 1
    return add(a - 1)
}
let b = add(10)
b

第四阶段，实现简单的类型。

fn add(a:int) {
    if (a == 1) return 1
    return add(a - 1)
}
let b = add("10") // 编译错。
b

技术选型

主体语言使用 Rust - 整个文章本就是作者学习 Rust 过程中的副产品。
解析器使用 nom (https://github.com/Geal/nom) - nom 是 combinator 类解析库里面比较有代表性的。combinator 是以函数作为解析单位，反复组合形成整体解析。还有一种解析库是 PEG 类型的，也就是直接写出 PEG 文件定义语法，由库直接生成整体解析器。比如 pest (https://bitbegin.github.io/pest-rs/) 。之所以选择 combinator 主要是想多用 Rust 写代码。
通用运行时 WASM - WASM 相对新潮、通用。能在多种平台上方便地运行。社区讨论也比较活跃。相关工具比较充足。
WASM 构建使用 parity_wasm (https://github.com/paritytech/parity-wasm) - 很方便的底层 WASM 构建。

一些要点

开发过程中遵循一些原则：

每个语法阶段都完成全流程，从解析到可运行。
AST 驱动，而不是以 parser 的实现作为先决条件。因为 parser 实现复杂，容易陷入细节。
多写测试。

Name		Name	Last commit message	Last commit date
Latest commit History 38 Commits
.github/workflows		.github/workflows
.vscode		.vscode
bian-desk		bian-desk
bian-front		bian-front
bian-lang		bian-lang
doc		doc
.gitignore		.gitignore
README.md		README.md

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

编写自己的（玩具）编程语言

语言设计目标

技术选型

一些要点

开始

About

Releases

Packages

Languages

nielinjie/bian-lang

Folders and files

Latest commit

History

Repository files navigation

编写自己的（玩具）编程语言

语言设计目标

技术选型

一些要点

开始

About

Topics

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages