* 川合のプログラミング言語自作のためのテキスト第三版#3 -(by [[K]], 2021.01.25) ** (7) TL-3 -TL-2に条件分岐や無条件分岐を付けてみようと思います。それでラベル定義、goto命令、if~goto命令の3つを追加してみました。 -gotoは嫌だと思う人もたくさんいそうですが、やはりどう考えてもgotoは説明が簡単で分かりやすいので、ここで扱うことにします。 -もしgotoを使いたくないと思ったら、whileやforを追加してみてください(ちょっと難しいかもしれないですが、いい練習になると思います)。 -条件分岐ができるようになるとループを使った簡単な性能試験ができるので、実行時間を表示させるためのtime命令も追加してあります。 #include <stdio.h> #include <stdlib.h> #include <string.h> #include <time.h> typedef unsigned char *String; // こう書くと String は unsigned char * の代用になる. void loadText(int argc, const char **argv, unsigned char *t, int siz) → TL-1と同じなので省略 int isAlphabet(unsigned char c) → TL-2と同じなので省略 int lexer(String s, String b, String t[]) → TL-2と同じなので省略 #define MAX_TC 255 // トークンコードの最大値. String ts[MAX_TC + 1]; // トークンの内容(文字列)を記憶. unsigned char tcBuf[10000]; int tcs = 0, tcb = 0; int getTc(String s) → TL-2と同じなので省略 int main(int argc, const char **argv) { int i, pc, pc1, var[256], tc[1000]; // 変数(var)とトークンコード(tc). String t[1000]; // トークン(t). unsigned char txt[10000], buf[10000]; // ソースコードとトークン用のバッファ. loadText(argc, argv, txt, 10000); pc1 = lexer(txt, buf, t); t[pc1] = t[pc1 + 1] = t[pc1 + 2] = t[pc1 + 3] = ""; // エラー表示用のために末尾にいくつか長さ0の文字列を登録しておく. for (pc = 0; pc < pc1; pc++) { // プログラム中で使われているすべてのトークンを調べて、tc[]の初期化. tc[pc] = getTc(t[pc]); } for (i = 0; i < tcs; i++) { // 定数の初期値を代入. var[i] = strtol(ts[i], 0, 0); // 定数だった場合に初期値を設定(定数ではないときは0になる). } + for (pc = 1; pc < pc1; pc++) { // ラベル定義命令を探して位置を登録. + if (strcmp(t[pc], ":") == 0) { + var[tc[pc - 1]] = pc + 1; // ラベル定義命令の次のpc値を記憶させておく. + } + } for (pc = 0; pc < pc1; pc++) { // プログラム実行開始. if (strcmp(t[pc + 1], "=") == 0) { // 2単語目が"=". if (strcmp(t[pc + 3], ";") == 0) { // 単純代入. var[tc[pc]] = var[tc[pc + 2]]; } else if (strcmp(t[pc + 3], "+") == 0 && strcmp(t[pc + 5], ";") == 0) { // 加算. var[tc[pc]] = var[tc[pc + 2]] + var[tc[pc + 4]]; } else if (strcmp(t[pc + 3], "-") == 0 && strcmp(t[pc + 5], ";") == 0) { // 減算. var[tc[pc]] = var[tc[pc + 2]] - var[tc[pc + 4]]; } else goto err; } else if (strcmp(t[pc], "print") == 0 && strcmp(t[pc + 2], ";") == 0) { // print. printf("%d\n", var[tc[pc + 1]]); + } else if (strcmp(t[pc + 1], ":") == 0) { // ラベル定義命令. + pc++; // 1単語だけ読み飛ばす(for文がもう1単語を読み飛ばしてくれる). + continue; + } else if (strcmp(t[pc], "goto") == 0 && strcmp(t[pc + 2], ";") == 0) { // goto. + pc = var[tc[pc + 1]] - 1; // for文がpc++するので、1を引いておく. + continue; + } else if (strcmp(t[pc], "if") == 0 && strcmp(t[pc + 1], "(") == 0 && strcmp(t[pc + 5], ")") == 0 && strcmp(t[pc + 6], "goto") == 0 && strcmp(t[pc + 8], ";") == 0) { // if (...) goto. + int pc1 = var[tc[pc + 7]] - 1, v0 = var[tc[pc + 2]], v1 = var[tc[pc + 4]]; + if (strcmp(t[pc + 3], "!=") == 0 && v0 != v1) { pc = pc1; continue; } // 条件が成立したらgoto処理. + if (strcmp(t[pc + 3], "==") == 0 && v0 == v1) { pc = pc1; continue; } // 条件が成立したらgoto処理. + } else if (strcmp(t[pc], "time") == 0) { + printf("time: %.3f[sec]\n", clock() / (double) CLOCKS_PER_SEC); } else goto err; while (strcmp(t[pc], ";") != 0) pc++; } exit(0); err: printf("syntax error : %s %s %s %s\n", t[pc], t[pc + 1], t[pc + 2], t[pc + 3]); exit(1); } -TL-2と比較すると、#includeが1行増えて、main関数に17行を書き足しただけです。だから合計で141行です。 -main関数内で追加した行の先頭には、わかりやすいように「+」でマークをつけておきました。実際に入力する際には、これをスペースにして入力してください。 -このTL-3は以下のようなプログラムを実行可能です。 i = 0; label: i = i + 1; if (i != 100000000) goto label; time; ** (8) TL-3の簡単な説明 -関数:(註:TL-2と全く同じです) --void loadText(int argc, const char **argv, String t, int siz) ---コマンドライン引数で指定されたソースファイルをtに読み込む。sizはtの最大サイズを表す(これを超える長さのファイルは途中で打ち切られる)。 --int isAlphabet(unsigned char c) ---引数で渡された文字コードが、アルファベットであれば1を返す。アルファベットでなければ0を返す。 ---アンダースコアもTL-3の中ではアルファベットということにしておく。そうすることで、変数の一文字目に使えるようになる。 --int lexer(String s, String b, String t[]) ---sにプログラムのソースコードを渡す。すると、t[]にトークン(単語)に切り分けられた文字列が入って返される。bは切り分けた文字列片をしまうところ。 ---より詳しい動作は[[a21_txt01_2a]]を参照のこと。 --int getTc(String s) ---トークン(単語)をsに渡すと、それに対応するトークンコード(整数)を返す。 --int main(int argc, const char **argv) ---言語処理の本体。 -変数:(註:TL-2と全く同じです) --String ts[] ---getTc()が管理している配列変数で、トークンコードからトークン文字列を得るために使う。 --unsigned char tcBuf[] ---getTc()が管理している変数で、トークン文字列の実体を保存しておくための場所。 --int tcs, tcb ---どちらもgetTc()が管理している変数で、tcsは今までに発行したトークンコードの個数(0~tcs-1が発行済み)。 ---tcbはtcBuf[]の未使用領域を指している。 ---- -ラベル定義命令では「abc:」という命令があった場合、「abc」という変数にpc値を記憶させておきます。つまりTL-3では、ラベル名と同じ変数名は同時には使えません。 -goto命令は、その値を利用してpc値を更新して、分岐を実現しているだけです。 -if~goto命令では、ifの中の条件が成立しているかどうかを調べて、もし成立していたらgoto部分を実行しているだけです。 -time命令についても、特に難しいことはないと思います。標準関数clock()を使って、TL-3が起動してからの起動時間を表示します。この関数を使うために<time.h>をincludeしています。 ** 次回に続く -次回: [[a21_txt01_4]] *こめんと欄 #comment