* 川合のプログラミング言語自作のためのテキスト第三版#4
-(by [[K]], 2021.01.27)

** (9) TL-4
-みなさんは「REPL」という言葉を知っているでしょうか。これは「Read-Eval-Print Loop」の略で、インタプリタが起動して、プロンプトからコマンドを入力すると(Read)、直ちに評価・実行されて(Eval)、結果が表示される(Print)、というのがループになっていて、何度でもできる機能のことです。
-これができるようになると、自作言語は見違えるほど魅力的になります。
-ということで、TL-4ではそれをやってみようと思います。

 #include <stdio.h>
 #include <stdlib.h>
 #include <string.h>
 #include <time.h>
 
 typedef unsigned char *String;	// こう書くと String は unsigned char * の代用になる.
 
 int loadText(String path, String t, int siz) // TL-1のとは違う(改造).
 {
     FILE *fp;
     unsigned char s[1000];
     int i = 0, j;
     if (path[0] == 34) { i = 1; } // ダブルフォールトがあればはずす.
     for (j = 0; ; j++) {
         if (path[i + j] == 0 || path[j + i] == 34)
             break; // ファイル名の末尾に来たらそこで終わり.
         s[j] = path[i + j];
     }
     s[j] = 0;
     fp = fopen(s, "rt"); // テキストモードでファイルを開く.
     if (fp == 0) {  // ファイルを開けなかった.
         printf("fopen error : %s\n", path);
         return 1;
     }
     i = fread(t, 1, siz - 1, fp);
     fclose(fp);
     t[i] = 0; // 終端マークを書いておく.
     return 0;
 }
 
 int isAlphabet(unsigned char c) → TL-2と同じなので省略
 
 int lexer(String s, String b, String t[]) → TL-2と同じなので省略
 
 #define MAX_TC  255 // トークンコードの最大値.
 String ts[MAX_TC + 1]; // トークンの内容(文字列)を記憶.
 unsigned char tcBuf[10000];
 int tcs = 0, tcb = 0;
 
 int getTc(String s) → TL-2と同じなので省略
 
 int pc, pc1, var[MAX_TC + 1], tc[1000];	// 変数(var)とトークンコード(tc).
 String t[1000];	// トークン(t).
 
 int run(String s)
 {
     clock_t t0 = clock();
     unsigned char buf[10000];
     int i, tcs0 = tcs;
     strcpy(s + strlen(s), ";");	// 末尾に「;」を付け忘れることが多いので、付けてあげる.
     pc1 = lexer(s, buf, t);
     t[pc1] = t[pc1 + 1] = t[pc1 + 2] = t[pc1 + 3] = "";	// エラー表示用のために末尾にいくつか長さ0の文字列を登録しておく.
     for (pc = 0; pc < pc1; pc++) { // プログラム中で使われているすべてのトークンを調べて、tc[]の初期化.
         tc[pc] = getTc(t[pc]);
     }
     for (i = tcs0; i < tcs; i++) { // 定数の初期値を代入.
         var[i] = strtol(ts[i], 0, 0);	// 定数だった場合に初期値を設定(定数ではないときは0になる).
     }
     for (pc = 1; pc < pc1; pc++) { // ラベル定義命令を探して位置を登録.
         if (strcmp(t[pc], ":") == 0) {
             var[tc[pc - 1]] = pc + 1; // ラベル定義命令の次のpc値を記憶させておく.
         }
     }
     for (pc = 0; pc < pc1; pc++) { // プログラム実行開始.
         if (strcmp(t[pc + 1], "=") == 0) { // 2単語目が"=".
             if (strcmp(t[pc + 3], ";") == 0) { // 単純代入.
                 var[tc[pc]] = var[tc[pc + 2]];
             } else if (strcmp(t[pc + 3], "+") == 0 && strcmp(t[pc + 5], ";") == 0) {  // 加算.
                 var[tc[pc]] = var[tc[pc + 2]] + var[tc[pc + 4]];
             } else if (strcmp(t[pc + 3], "-") == 0 && strcmp(t[pc + 5], ";") == 0) {  // 減算.
                 var[tc[pc]] = var[tc[pc + 2]] - var[tc[pc + 4]];
             } else
                 goto err;
         } else if (strcmp(t[pc], "print") == 0 && strcmp(t[pc + 2], ";") == 0) { // print.
             printf("%d\n", var[tc[pc + 1]]);
         } else if (strcmp(t[pc + 1], ":") == 0) {	// ラベル定義命令.
             pc++; // 1単語だけ読み飛ばす(for文がもう1単語を読み飛ばしてくれる).
             continue;
         } else if (strcmp(t[pc], "goto") == 0 && strcmp(t[pc + 2], ";") == 0) { // goto.
             pc = var[tc[pc + 1]] - 1; // for文がpc++するので、1を引いておく.
             continue;
         } else if (strcmp(t[pc], "if") == 0 && strcmp(t[pc + 1], "(") == 0 && strcmp(t[pc + 5], ")") == 0 && strcmp(t[pc + 6], "goto") == 0 && strcmp(t[pc + 8], ";") == 0) {	// if (...) goto.
             int pc1 = var[tc[pc + 7]] - 1, v0 = var[tc[pc + 2]], v1 = var[tc[pc + 4]];
             if (strcmp(t[pc + 3], "!=") == 0 && v0 != v1) { pc = pc1; continue; }
             if (strcmp(t[pc + 3], "==") == 0 && v0 == v1) { pc = pc1; continue; }
         } else if (strcmp(t[pc], "time") == 0) {
             printf("time: %.3f[sec]\n", (clock() - t0) / (double) CLOCKS_PER_SEC);
	 } else if (strcmp(t[pc], ";") == 0) {
             // 何もしない.
         } else
             goto err;
         while (strcmp(t[pc], ";") != 0)
             pc++;
     }
     return 0;
 err:
     printf("syntax error : %s %s %s %s\n", t[pc], t[pc + 1], t[pc + 2], t[pc + 3]);
     return 1;
 }
 
 int main(int argc, const char **argv)
 {
     unsigned char txt[10000];
     int i;
     if (argc >= 2) {
         if (loadText((String) argv[1], txt, 10000) == 0) {
             run(txt);
         }
         exit(0);
     }
     for (;;) { // Read-Eval-Print Loop.
         printf("\n>");
         fgets(txt, 10000, stdin);
         i = strlen(txt);
         if (txt[i - 1] == '\n') { // 末尾に改行コードが付いていればそれを消す.
             txt[i - 1] = 0;
         }
         if (strncmp(txt, "run ", 4) == 0) {
             if (loadText(&txt[4], txt, 10000) == 0) {
                 run(txt);
             }
         } else if (strcmp(txt, "exit") == 0) {
             exit(0);
         } else {
             run(txt);
         }
     }
 }
-TL-3と比較すると、まずloadText()をコマンドライン引数以外でも使えるように改造しました。次にmain()の中にあったプログラム実行部分をrun()関数に切り出しました。その上で、main()内に Read-Eval-Print Loop を作りこんでいます。
-また「;」だけの場合に何もしないという処理も追加しました。これで余計な「;」がいくつあってもエラーにはならなくなります。
-そしてコマンド入力で、末尾の「;」をよく忘れるのでrun()の最初で「;」を付与する処理を追加しています。
-これらの改造により、実行すると以下のようになります。

 C:\a21_txt01>tl4
 
 >run tl3.txt                 ← TL-3用の1億回ループのプログラムを実行させました。
 time: 15.117[sec]
 
 >print i                     ← 実行後に、変数iの値を確認してみました。
 100000000                    ← あっています。
 
 >a=0; label: print a; a=a+1; if (a != 10) goto label;  ← 頑張って一行で書けば、こんなのも実行できます。
 0
 1
 2
 3
 4
 5
 6
 7
 8
 9
 
 >exit                        ← 終了コマンド。
 
 c:\a21_txt01>
-私はとても楽しいです!

-実行速度を計ってみたところ、TL-3よりもわずかに遅くなっていました。これはなぜかというと、たぶん何もしない「;」の処理を追加した影響ではないかと思われます。

** (10) TL-3の補足説明
-説明するところはあまりないのですが、一応新しいloadText()の中身について説明しておきます。
-(工事中)
-最初にしていることは、path[]からs[]を作ることです。
-もしダブルクォートが先頭についていたらそれを読み飛ばすようにします(ダブルクォートは「"」のことです。文字コードは34番です)。
-そしてダブルクォートもしくは文字コード0までをs[]にコピーします。
-この処理によって「tl3.txt」と「"tl3.txt"」のどちらでもファイルが開けるようになります。



** 次回に続く
-次回: [[a21_txt01_5]]

*こめんと欄
#comment


トップ   新規 一覧 単語検索 最終更新   ヘルプ   最終更新のRSS