用魔法打败魔法:C++模板元编程实现的scheme元循环求值器
前言
寒假时沉迷C++模板元编程,写了个简单的Scheme元循环求值器。可以用类似Scheme的语法写出这样的C++模板代码:
1 |
|
等价的Scheme代码是这样的:
1 |
|
可以在运行时输出表达式的值:
1 |
|
还有一些简单的例子:
1 |
|
1 |
|
1 |
|
当然求值的结果也可以在编译期使用,只是懒得实现了(毕竟本质玩具……而且C++编译期计算用constexpr函数就足够了)。
代码以及详细的介绍位于https://github.com/Light-of-Hers/CCTV
写完后就忘了这茬事了……
这学期修了胡振江老师的PL课,突然想起了自己写的这个玩具,便写下此文记录一下。
语法元素
- 用变参模板来表示scheme中的列表(list)。
- 用普通类来表示不携带其他信息的token,比如关键词(keyword)、标识符(identifier)等。
- 用模板类来表示携带额外信息的token,比如字面量(literal):number、boolean等。
- 用模板类来表示denotable value,比如pair、closure等。
其中list和token是用户可见的,为了方便用户的书写:
- keyword提前声明好,这样用户可以直接写
lambda
来表示scheme中的lambda
。- 部分keyword和C++的keyword冲突,做了一些修改,如用
iff
表示if
。
- 部分keyword和C++的keyword冲突,做了一些修改,如用
- 表示list的模板名取为
_
,这样用户就可以用_<a, b, c>
来表示scheme中的(a b c)
。 - 用一个macro来声明代表identifier的普通类:
#define V(x) struct x
,这样用户可以用V(abc)
来表示标识符abc
了。而且同一个标识符只要用该宏生成一次(同名类只需声明一次),之后的使用可以不再套个宏了。 - 用宏
N(n)
来表示number字面量n
,用B(b)
来表示boolean字面量b
。
考虑到keyword、identifier、denotable value等都用类来表示,故使用继承结构来进行区分:
lang
keyword
lambda
,iff
, …
value
pair_value
pair
atom_value
null_atom
null
number_atom
number
boolean_atom
boolean
procedure_atom
closure
primitive
所有没有继承自lang
的类都视为identifier。
表达式求值
C++的模板可以进行pattern match,因此求值函数大部分时候写起来还是蛮轻松的,就不多说了。
不过因为C++模板运算是pure functional的,就导致letrec
的实现稍微费了点心思。
r6rs和racket的letrec
的是借助side effect(let
/let*
和set!
的语法糖)实现的,而用C++模板实现side effect不太现实(让我用state passing style来实现side effect的话还不如要side effect……)。
fix-point组合子倒是很好的解决方案,不过当时我还没有这方面知识……因此想了个稍显古怪但还挺不错的解决方案:
- 将environment-frame分类为normal-frame和recurse-frame(前者表示
lambda
和let
等普通的绑定生成的frame,后者表示letrec
生成的frame):- 每个frame都有一个前驱frame的引用,一个identifier以及其绑定的value。
- 一个recurse-frame还有一个标记来表示前驱frame是否和该frame由同一个
letrec
的bindings生成。
- 求值
letrec
的bindings时,按照let*
的规则进行,只是生成的frame为recurse-frame。 - 对environment进行lookup时,若匹配到一个recurse-frame
(其所在letrec
所生成frame中的最下游frame为),且其绑定的value为包含一个closure ,绑定的environment为,则:
- 若
的前驱frame 为所绑定的frame的祖先,即,则返回一个新的closure ,只有绑定的environment与不同,为- 。
否则,直接返回
- 。
后记
谨以此纪念寒假的摸鱼时光。