申明不会采用典型教科书上关于编译器的教学顺序,比如:
- An introductory chapter describing what a compiler is.
- A chapter or two on syntax equations, using Backus-Naur Form (BNF).
- A chapter or two on lexical scanning, with emphasis on
- deterministic and non-deterministic finite automata.
- Several chapters on parsing theory, beginning with top-down
- recursive descent, and ending with LALR parsers.
- A chapter on intermediate languages, with emphasis on P-code
- and similar reverse polish representations.
- Many chapters on alternative ways to handle subroutines and
- parameter passing, type declarations, and such.
- A chapter toward the end on code generation, usually for some
- imaginary CPU with a simple instruction set. Most readers (and in fact, most college classes) never make it this far.
- A final chapter or two on optimization. This chapter often
- goes unread, too.
作者不会遵照这些,而是带着你直接上手写一个能工作的编译器,采用他的方式:
- KISS原则
- 所有的Identifier用single character来代替,不考虑空格(即词法规定不允许用户写空格)。作者认为如果他能正确处理I-T-L,那么他也能让IF-THEN-ELSE工作
- 只处理实时I/O,不处理File I/O。
- 忽略error correction/recovery。遇到第一个error即停机,但这不是崩溃。
- 只讨论一种情形的解析:top-down、recursive descent parsing
- 自顶向下、递归下降的情形,作者认为这是唯一一种支持手写编译器的技术选型
- 从源代码直接生成汇编代码。不需要中间码
- 延后对module的构建,直至真的需要它的时候
- 把每一个将来可能会用上的功能都提前封装是一个疯狂的做法,几乎肯定是错误的
- 尽量使用现有的module,除非你真的需要一个更强大的一点的,即便如此,也仅仅把注意力集中到该module上
- 不纠缠于P-code等中间码或者想象的CPUs等,从第一天开始做出来的东西就要是可以工作的,即便它不完善