用魔法打败魔法:C++模板元编程实现的scheme元循环求值器
前言
寒假时沉迷C++模板元编程,写了个简单的Scheme元循环求值器。可以用类似Scheme的语法写出这样的C++模板代码:
1 | |
等价的Scheme代码是这样的:
1 | |
可以在运行时输出表达式的值:
1 | |
还有一些简单的例子:
1 | |
1 | |
1 | |
当然求值的结果也可以在编译期使用,只是懒得实现了(毕竟本质玩具……而且C++编译期计算用constexpr函数就足够了)。
代码以及详细的介绍位于https://github.com/Light-of-Hers/CCTV
写完后就忘了这茬事了……
这学期修了胡振江老师的PL课,突然想起了自己写的这个玩具,便写下此文记录一下。
语法元素
- 用变参模板来表示scheme中的列表(list)。
- 用普通类来表示不携带其他信息的token,比如关键词(keyword)、标识符(identifier)等。
- 用模板类来表示携带额外信息的token,比如字面量(literal):number、boolean等。
- 用模板类来表示denotable value,比如pair、closure等。
其中list和token是用户可见的,为了方便用户的书写:
- keyword提前声明好,这样用户可以直接写
lambda来表示scheme中的lambda。- 部分keyword和C++的keyword冲突,做了一些修改,如用
iff表示if。
- 部分keyword和C++的keyword冲突,做了一些修改,如用
- 表示list的模板名取为
_,这样用户就可以用_<a, b, c>来表示scheme中的(a b c)。 - 用一个macro来声明代表identifier的普通类:
#define V(x) struct x,这样用户可以用V(abc)来表示标识符abc了。而且同一个标识符只要用该宏生成一次(同名类只需声明一次),之后的使用可以不再套个宏了。 - 用宏
N(n)来表示number字面量n,用B(b)来表示boolean字面量b。
考虑到keyword、identifier、denotable value等都用类来表示,故使用继承结构来进行区分:
langkeywordlambda,iff, …
valuepair_valuepair
atom_valuenull_atomnull
number_atomnumber
boolean_atomboolean
procedure_atomclosureprimitive
所有没有继承自lang的类都视为identifier。
表达式求值
C++的模板可以进行pattern match,因此求值函数大部分时候写起来还是蛮轻松的,就不多说了。
不过因为C++模板运算是pure functional的,就导致letrec的实现稍微费了点心思。
r6rs和racket的letrec的是借助side effect(let/let*和set!的语法糖)实现的,而用C++模板实现side effect不太现实(让我用state passing style来实现side effect的话还不如要side effect……)。
fix-point组合子倒是很好的解决方案,不过当时我还没有这方面知识……因此想了个稍显古怪但还挺不错的解决方案:
- 将environment-frame分类为normal-frame和recurse-frame(前者表示
lambda和let等普通的绑定生成的frame,后者表示letrec生成的frame):- 每个frame都有一个前驱frame的引用,一个identifier以及其绑定的value。
- 一个recurse-frame还有一个标记来表示前驱frame是否和该frame由同一个
letrec的bindings生成。
- 求值
letrec的bindings时,按照let*的规则进行,只是生成的frame为recurse-frame。 - 对environment进行lookup时,若匹配到一个recurse-frame
(其所在letrec所生成frame中的最下游frame为),且其绑定的value为包含一个closure ,绑定的environment为,则:
- 若
的前驱frame 为所绑定的frame的祖先,即,则返回一个新的closure ,只有绑定的environment与不同,为- 。
否则,直接返回
- 。
后记
谨以此纪念寒假的摸鱼时光。