川合のプログラミング言語自作のためのテキスト第三版#3
(1) HL-3
- HL-2に条件分岐や無条件分岐を付けてみようと思います。それでラベル定義、goto命令、if~goto命令の3つを追加してみました。
- gotoは嫌だと思う人もたくさんいそうですが、やはりどう考えてもgotoは説明が簡単で分かりやすいので、ここで扱うことにします。
- goto以外の制御構文はHL-8で導入予定です。
- 条件分岐ができるようになるとループを使った簡単な性能試験ができるので、実行時間を表示させるためのtime命令も追加してあります。
#include <stdio.h>
#include <stdlib.h>
#include <string.h>
#include <time.h> ← この行を追加
typedef unsigned char *String; // こう書くと String は unsigned char * の代用になる.
void loadText(int argc, const char **argv, unsigned char *t, int siz) → HL-1と同じなので省略
(以下ずっとHL-2と同じなので省略)
int main(int argc, const char **argv)
{
int pc, pc1;
unsigned char txt[10000]; // ソースコード用のバッファ.
loadText(argc, argv, txt, 10000);
pc1 = lexer(txt, tc);
tc[pc1] = tc[pc1 + 1] = tc[pc1 + 2] = tc[pc1 + 3] = getTc(".", 1); // エラー表示用のために末尾にピリオドを登録しておく.
int semi = getTc(";", 1);
+ for (pc = 0; pc < pc1; pc++) { // ラベル定義命令を探して位置を登録.
+ if (tc[pc + 1] == getTc(":", 1)) {
+ var[tc[pc]] = pc + 2; // ラベル定義命令の次のpc値を変数に記憶させておく.
+ }
+ }
! for (pc = 0; pc < pc1;) { // プログラム実行開始.
if (tc[pc + 1] == getTc("=", 1) && tc[pc + 3] == semi) { // 単純代入.
var[tc[pc]] = var[tc[pc + 2]];
} else if (tc[pc + 1] == getTc("=", 1) && tc[pc + 3] == getTc("+", 1) && tc[pc + 5] == semi) { // 加算.
var[tc[pc]] = var[tc[pc + 2]] + var[tc[pc + 4]];
} else if (tc[pc + 1] == getTc("=", 1) && tc[pc + 3] == getTc("-", 1) && tc[pc + 5] == semi) { // 減算.
var[tc[pc]] = var[tc[pc + 2]] - var[tc[pc + 4]];
} else if (tc[pc] == getTc("print", 5) && tc[pc + 2] == semi) { // print.
printf("%d\n", var[tc[pc + 1]]);
+ } else if (tc[pc + 1] == getTc(":", 1)) { // ラベル定義命令.
+ pc += 2; // 何もしないで読み飛ばす.
+ continue;
+ } else if (tc[pc] == getTc("goto", 4) && tc[pc + 2] == semi) { // goto.
+ pc = var[tc[pc + 1]];
+ continue;
+ } else if (tc[pc] == getTc("if", 2) && tc[pc + 1] == getTc("(", 1) && tc[pc + 5] == getTc(")", 1) && tc[pc + 6] == getTc("goto", 4) && tc[pc + 8] == semi) { // if (...) goto.
+ int gpc = var[tc[pc + 7]], v0 = var[tc[pc + 2]], v1 = var[tc[pc + 4]];
+ if (tc[pc + 3] == getTc("!=", 2) && v0 != v1) { pc = gpc; continue; } // 条件が成立したらgoto処理.
+ if (tc[pc + 3] == getTc("==", 2) && v0 == v1) { pc = gpc; continue; } // 条件が成立したらgoto処理.
+ if (tc[pc + 3] == getTc("<", 1) && v0 < v1) { pc = gpc; continue; } // 条件が成立したらgoto処理.
+ } else if (tc[pc] == getTc("time", 4) && tc[pc + 1] == semi) {
+ printf("time: %.3f[sec]\n", clock() / (double) CLOCKS_PER_SEC);
} else
goto err;
while (tc[pc] != semi)
pc++;
+ pc++; // セミコロンを読み飛ばす.
}
exit(0);
err:
printf("syntax error : %s %s %s %s\n", ts[tc[pc]], ts[tc[pc + 1]], ts[tc[pc + 2]], ts[tc[pc + 3]]);
exit(1);
}
- HL-2と比較すると、#includeが1行増えて、main関数を1行改変してさらに19行を書き足しただけです。だから合計で148行です。
- main関数内で追加した行の先頭には、わかりやすいように「+」でマークをつけておきました。改変のあった行には「!」を付けておきました。実際に入力する際には、これらスペースにして入力してください。
- このHL-3は以下のようなプログラムを実行可能です。
i = 0;
label:
i = i + 1;
if (i < 100000000) goto label;
time;
(2) HL-3の簡単な説明
- 関数:(註:HL-2と全く同じです)
- void loadText(int argc, const char **argv, String t, int siz)
- コマンドライン引数で指定されたソースファイルをtに読み込む。sizはtの最大サイズを表す(これを超える長さのファイルは途中で打ち切られる)。
- int getTc(String s, int len)
- トークン(単語)をsに渡すと、それに対応するトークンコード(整数)を返す。
- int isAlphabetOrNumber(unsigned char c)
- 引数で渡された文字コードが、英数字であれば1を返す。それ以外なら0を返す。
- アンダースコアもHL-3の中ではアルファベットということにしておく。そうすることで、変数の一文字目に使えるようになる。
- この関数は以下のlexer()の下請け。
- int lexer(String s, int tc[])
- sにプログラムのソースコードを渡す。すると、tc[]にトークンコード(単語番号)に変換させられた数列が入って返される。
- より詳しい動作は、a21_txt01_2aを参照のこと。
- int main(int argc, const char **argv)
- 変数:
- String ts[]
- getTc()が管理している配列変数で、トークンコードからトークン文字列を得るために使う。
- int tl[]
- getTc()が管理している配列変数で、トークンコードからトークン文字列の長さを得るために使う。
- unsigned char tcBuf[]
- getTc()が管理している変数で、トークン文字列の実体を保存しておくための場所。
- int tcs, tcb
- どちらもgetTc()が管理している変数で、tcsは今までに発行したトークンコードの個数(0~tcs-1が発行済み)。
- tcbはtcBuf[]の未使用領域を指している。
- もしtcBuf[]やtcbの役割がピンとこない場合は、a21_txt01_2bを参照。
- int Var[]
- 変数の値を記憶しておくための変数。トークンコードをそのまま変数番号に転用している。
- int tc[]
- プログラムをトークンコード列に変換したものがここに入る。
- ラベル定義命令では「abc:」という命令があった場合、「abc」という変数にpc値を記憶させておきます。つまりHL-3では、ラベル名と同じ変数名は同時には使えません。
- goto命令は、その値を利用してpc値を更新して、分岐を実現しています。
- if~goto命令では、ifの中の条件が成立しているかどうかを調べて、もし成立していたらgoto部分を実行しているだけです。
- time命令についても、特に難しいことはないと思います。標準関数clock()を使って、TL-3が起動してからの起動時間を表示します。この関数を使うために<time.h>をincludeしています。
次回に続く
こめんと欄