* 川合のプログラミング言語自作のためのテキスト第三版#3
-(by [[K]], 2021.01.25)
-(by [[K]], 2021.03.01)

** (7) TL-3
-TL-2に条件分岐や無条件分岐を付けてみようと思います。それでラベル定義、goto命令、if~goto命令の3つを追加してみました。
** (1) HL-3
-HL-2に条件分岐や無条件分岐を付けてみようと思います。それでラベル定義、goto命令、if~goto命令の3つを追加してみました。
-gotoは嫌だと思う人もたくさんいそうですが、やはりどう考えてもgotoは説明が簡単で分かりやすいので、ここで扱うことにします。
-もしgotoを使いたくないと思ったら、whileやforを追加してみてください(ちょっと難しいかもしれないですが、いい練習になると思います)。
-goto以外の制御構文はHL-8で導入予定です。
-条件分岐ができるようになるとループを使った簡単な性能試験ができるので、実行時間を表示させるためのtime命令も追加してあります。

 #include <stdio.h>
 #include <stdlib.h>
 #include <string.h>
 #include <time.h>
 #include <time.h> ← この行を追加
 
 typedef unsigned char *String;	// こう書くと String は unsigned char * の代用になる.
 
 void loadText(int argc, const char **argv, unsigned char *t, int siz) → TL-1と同じなので省略
 void loadText(int argc, const char **argv, unsigned char *t, int siz) → HL-1と同じなので省略
 
 int isAlphabet(unsigned char c) → TL-2と同じなので省略
 (以下ずっとHL-2と同じなので省略)
 
 int lexer(String s, String b, String t[]) → TL-2と同じなので省略
 
 #define MAX_TC  255 // トークンコードの最大値.
 String ts[MAX_TC + 1]; // トークンの内容(文字列)を記憶.
 int tcs = 0; 
 
 int getTc(String s) → TL-2と同じなので省略
 
 int main(int argc, const char **argv)
 {
     int i, pc, pc1, var[256], tc[1000];	// 変数(var)とトークンコード(tc).
     String t[1000];	// トークン(t).
     unsigned char txt[10000], buf[10000]; // ソースコードとトークン用のバッファ.
     int pc, pc1;
     unsigned char txt[10000]; // ソースコード用のバッファ.
     loadText(argc, argv, txt, 10000);
     pc1 = lexer(txt, buf, t);
     t[pc1] = t[pc1 + 1] = t[pc1 + 2] = t[pc1 + 3] = "";	// エラー表示用のために末尾にいくつか長さ0の文字列を登録しておく.
     for (pc = 0; pc < pc1; pc++) { // プログラム中で使われているすべてのトークンを調べて、tc[]の初期化.
         tc[pc] = getTc(t[pc]);
     }
     for (i = 0; i < tcs; i++) { // 定数の初期値を代入.
         var[i] = strtol(ts[i], 0, 0);	// 定数だった場合に初期値を設定(定数ではないときは0になる).
     }
 +   for (pc = 1; pc < pc1; pc++) { // ラベル定義命令を探して位置を登録.
 +       if (strcmp(t[pc], ":") == 0) {
 +           var[tc[pc - 1]] = pc + 1; // ラベル定義命令の次のpc値を記憶させておく.
     pc1 = lexer(txt, tc);
     tc[pc1] = tc[pc1 + 1] = tc[pc1 + 2] = tc[pc1 + 3] = getTc(".", 1);	// エラー表示用のために末尾にピリオドを登録しておく.
     int semi = getTc(";", 1);
 +   for (pc = 0; pc < pc1; pc++) { // ラベル定義命令を探して位置を登録.
 +       if (tc[pc + 1] == getTc(":", 1)) {
 +           var[tc[pc]] = pc + 2; // ラベル定義命令の次のpc値を変数に記憶させておく.
 +       }
 +   }
     for (pc = 0; pc < pc1; pc++) { // プログラム実行開始.
         if (strcmp(t[pc + 1], "=") == 0) { // 2単語目が"=".
             if (strcmp(t[pc + 3], ";") == 0) { // 単純代入.
                 var[tc[pc]] = var[tc[pc + 2]];
             } else if (strcmp(t[pc + 3], "+") == 0 && strcmp(t[pc + 5], ";") == 0) {  // 加算.
                 var[tc[pc]] = var[tc[pc + 2]] + var[tc[pc + 4]];
             } else if (strcmp(t[pc + 3], "-") == 0 && strcmp(t[pc + 5], ";") == 0) {  // 減算.
                 var[tc[pc]] = var[tc[pc + 2]] - var[tc[pc + 4]];
             } else
                 goto err;
        } else if (strcmp(t[pc], "print") == 0 && strcmp(t[pc + 2], ";") == 0) { // print.
            printf("%d\n", var[tc[pc + 1]]);
 +      } else if (strcmp(t[pc + 1], ":") == 0) {	// ラベル定義命令.
 +          pc++; // 1単語だけ読み飛ばす(for文がもう1単語を読み飛ばしてくれる).
 +          continue;
 +      } else if (strcmp(t[pc], "goto") == 0 && strcmp(t[pc + 2], ";") == 0) { // goto.
 +           pc = var[tc[pc + 1]] - 1; // for文がpc++するので、1を引いておく.
 !   for (pc = 0; pc < pc1;) { // プログラム実行開始.
         if (tc[pc + 1] == getTc("=", 1) && tc[pc + 3] == semi) { // 単純代入.
             var[tc[pc]] = var[tc[pc + 2]];
         } else if (tc[pc + 1] == getTc("=", 1) && tc[pc + 3] == getTc("+", 1) && tc[pc + 5] == semi) {  // 加算.
             var[tc[pc]] = var[tc[pc + 2]] + var[tc[pc + 4]];
         } else if (tc[pc + 1] == getTc("=", 1) && tc[pc + 3] == getTc("-", 1) && tc[pc + 5] == semi) {  // 減算.
             var[tc[pc]] = var[tc[pc + 2]] - var[tc[pc + 4]];
         } else if (tc[pc] == getTc("print", 5) && tc[pc + 2] == semi) { // print.
             printf("%d\n", var[tc[pc + 1]]);
 +       } else if (tc[pc + 1] == getTc(":", 1)) {	// ラベル定義命令.
 +           pc += 2; // 何もしないで読み飛ばす.
 +           continue;
 +      } else if (strcmp(t[pc], "if") == 0 && strcmp(t[pc + 1], "(") == 0 && strcmp(t[pc + 5], ")") == 0 && strcmp(t[pc + 6], "goto") == 0 && strcmp(t[pc + 8], ";") == 0) {	// if (...) goto.
 +           int pc1 = var[tc[pc + 7]] - 1, v0 = var[tc[pc + 2]], v1 = var[tc[pc + 4]];
 +           if (strcmp(t[pc + 3], "!=") == 0 && v0 != v1) { pc = pc1; continue; } // 条件が成立したらgoto処理.
 +           if (strcmp(t[pc + 3], "==") == 0 && v0 == v1) { pc = pc1; continue; } // 条件が成立したらgoto処理.
 +      } else if (strcmp(t[pc], "time") == 0) {
 +           printf("time: %.3f[sec]\n", clock() / (double) CLOCKS_PER_SEC);
        } else
            goto err;
        while (strcmp(t[pc], ";") != 0)
            pc++;
 +       } else if (tc[pc] == getTc("goto", 4) && tc[pc + 2] == semi) { // goto.
 +            pc = var[tc[pc + 1]];
 +            continue;
 +       } else if (tc[pc] == getTc("if", 2) && tc[pc + 1] == getTc("(", 1) && tc[pc + 5] == getTc(")", 1) && tc[pc + 6] == getTc("goto", 4) && tc[pc + 8] == semi) {	// if (...) goto.
 +            int gpc = var[tc[pc + 7]], v0 = var[tc[pc + 2]], v1 = var[tc[pc + 4]];
 +            if (tc[pc + 3] == getTc("!=", 2) && v0 != v1) { pc = gpc; continue; } // 条件が成立したらgoto処理.
 +            if (tc[pc + 3] == getTc("==", 2) && v0 == v1) { pc = gpc; continue; } // 条件が成立したらgoto処理.
 +            if (tc[pc + 3] == getTc("<",  1) && v0 <  v1) { pc = gpc; continue; } // 条件が成立したらgoto処理.
 +       } else if (tc[pc] == getTc("time", 4) && tc[pc + 1] == semi) {
 +            printf("time: %.3f[sec]\n", clock() / (double) CLOCKS_PER_SEC);
         } else
             goto err;
         while (tc[pc] != semi)
             pc++;
 +       pc++; // セミコロンを読み飛ばす.
     }
     exit(0);
 err:
     printf("syntax error : %s %s %s %s\n", t[pc], t[pc + 1], t[pc + 2], t[pc + 3]);
     printf("syntax error : %s %s %s %s\n", ts[tc[pc]], ts[tc[pc + 1]], ts[tc[pc + 2]], ts[tc[pc + 3]]);
     exit(1);
 }
-TL-2と比較すると、#includeが1行増えて、main関数に17行を書き足しただけです。だから合計で138行です。
-main関数内で追加した行の先頭には、わかりやすいように「+」でマークをつけておきました。実際に入力する際には、これをスペースにして入力してください。
-このTL-3は以下のようなプログラムを実行可能です。

-HL-2と比較すると、#includeが1行増えて、main関数を1行改変してさらに19行を書き足しただけです。だから合計で148行です。
-main関数内で追加した行の先頭には、わかりやすいように「+」でマークをつけておきました。改変のあった行には「!」を付けておきました。実際に入力する際には、これらをスペースにして入力してください。
-このHL-3は以下のようなプログラムを実行可能です。

     i = 0;
 label:
     i = i + 1;
     if (i != 100000000) goto label;
     if (i < 100000000) goto label;
     time;
** (8) TL-3の簡単な説明
-ラベル定義命令では「abc:」という命令があった場合、「abc」という変数にpc値を記憶させておきます。つまりTL-3では、ラベル名と同じ変数名は同時には使えません。
-goto命令は、その値を利用してpc値を更新して、分岐を実現しているだけです。

** (2) HL-3の簡単な説明
-関数:(註:HL-2と全く同じです)
--void loadText(int argc, const char **argv, String t, int siz)
---コマンドライン引数で指定されたソースファイルをtに読み込む。sizはtの最大サイズを表す(これを超える長さのファイルは途中で打ち切られる)。
--int getTc(String s, int len)
---トークン(単語)をsに渡すと、それに対応するトークンコード(整数)を返す。
--int isAlphabetOrNumber(unsigned char c)
---引数で渡された文字コードが、英数字であれば1を返す。それ以外なら0を返す。
---アンダースコアもHL-3の中ではアルファベットということにしておく。そうすることで、変数の一文字目に使えるようになる。
---この関数は以下のlexer()の下請け。
--int lexer(String s, int tc[])
---sにプログラムのソースコードを渡す。すると、tc[]にトークンコード(単語番号)に変換させられた数列が入って返される。
---より詳しい動作は、[[a21_txt01_2a]]を参照のこと。
--int main(int argc, const char **argv)
---言語処理の本体。

-変数:
--String ts[]
---getTc()が管理している配列変数で、トークンコードからトークン文字列を得るために使う。
--int tl[]
---getTc()が管理している配列変数で、トークンコードからトークン文字列の長さを得るために使う。
--unsigned char tcBuf[]
---getTc()が管理している変数で、トークン文字列の実体を保存しておくための場所。
--int tcs, tcb
---どちらもgetTc()が管理している変数で、tcsは今までに発行したトークンコードの個数(0~tcs-1が発行済み)。
---tcbはtcBuf[]の未使用領域を指している。
---もしtcBuf[]やtcbの役割がピンとこない場合は、[[a21_txt01_2b]]を参照。
--int var[]
---変数の値を記憶しておくための変数。トークンコードをそのまま変数番号に転用している。
--int tc[]
---プログラムをトークンコード列に変換したものがここに入る。
----
-ラベル定義命令では「abc:」という命令があった場合、「abc」という変数にpc値を記憶させておきます。つまりHL-3では、ラベル名と同じ変数名は同時には使えません。
-goto命令は、その値を利用してpc値を更新して、分岐を実現しています。
-if~goto命令では、ifの中の条件が成立しているかどうかを調べて、もし成立していたらgoto部分を実行しているだけです。
-time命令についても、特に難しいことはないと思います。標準関数clock()を使って、TL-3が起動してからの起動時間を表示します。この関数を使うために<time.h>をincludeしています。
-time命令についても、特に難しいことはないと思います。標準関数clock()を使って、HL-3が起動してからの起動時間を表示します。この関数を使うために<time.h>をincludeしています。

** 次回に続く
-次回: ''a21_txt01_4''
-次回: [[a21_txt01_4]]

*こめんと欄
#comment


トップ   新規 一覧 単語検索 最終更新   ヘルプ   最終更新のRSS