a21_txt01_4
をテンプレートにして作成
[
トップ
] [
新規
|
一覧
|
単語検索
|
最終更新
|
ヘルプ
]
開始行:
* 川合のプログラミング言語自作のためのテキスト第三版#4
-(by [[K]], 2021.03.01)
** (1) HL-4
-みなさんは「REPL」という言葉を知っているでしょうか。これ...
-これができるようになると、自作言語は見違えるほど魅力的に...
-ということで、HL-4ではそれをやってみようと思います。
#include <stdio.h>
#include <stdlib.h>
#include <string.h>
#include <time.h>
typedef unsigned char *String; // こう書くと String は u...
int loadText(String path, String t, int siz) // TL-1のと...
{
FILE *fp;
unsigned char s[1000];
int i = 0, j;
if (path[0] == 34) { i = 1; } // ダブルフォールトが...
for (j = 0; ; j++) {
if (path[i + j] == 0 || path[j + i] == 34)
break; // ファイル名の末尾に来たらそこで終わ...
s[j] = path[i + j];
}
s[j] = 0;
fp = fopen(s, "rt"); // テキストモードでファイルを開...
if (fp == 0) { // ファイルを開けなかった.
printf("fopen error : %s\n", path);
return 1; // 失敗.
}
i = fread(t, 1, siz - 1, fp);
fclose(fp);
t[i] = 0; // 終端マークを書いておく.
return 0; // 成功.
}
////////////////////////////////////////////////////////...
#define MAX_TC 255 // トークンコードの最大値.
String ts[MAX_TC + 1]; // トークンの内容(文字列)を記憶.
int tl[MAX_TC + 1]; // トークンの長さ.
unsigned char tcBuf[(MAX_TC + 1) * 10]; // トークン1つ当...
int tcs = 0, tcb = 0;
int var[MAX_TC + 1]; // 変数.
int getTc(String s, int len) → TL-2と同じなので省略
////////////////////////////////////////////////////////...
int isAlphabet(unsigned char c) → TL-2と同じなので省略
int lexer(String s, int tc[]) → TL-2と同じなので省略
int tc[10000]; // トークンコード.
////////////////////////////////////////////////////////...
int run(String s)
{
clock_t t0 = clock();
int pc, pc1;
pc1 = lexer(s, tc);
tc[pc1++] = getTc(";", 1); // 末尾に「;」を付け忘れ...
tc[pc1] = tc[pc1 + 1] = tc[pc1 + 2] = tc[pc1 + 3] = ...
int semi = getTc(";", 1);
for (pc = 0; pc < pc1; pc++) { // ラベル定義命令を探...
if (tc[pc + 1] == getTc(":", 1)) {
var[tc[pc]] = pc + 2; // ラベル定義命令の次...
}
}
for (pc = 0; pc < pc1;) { // プログラム実行開始.
if (tc[pc + 1] == getTc("=", 1) && tc[pc + 3] ==...
var[tc[pc]] = var[tc[pc + 2]];
} else if (tc[pc + 1] == getTc("=", 1) && tc[pc ...
var[tc[pc]] = var[tc[pc + 2]] + var[tc[pc + ...
} else if (tc[pc + 1] == getTc("=", 1) && tc[pc ...
var[tc[pc]] = var[tc[pc + 2]] - var[tc[pc + ...
} else if (tc[pc] == getTc("print", 5) && tc[pc ...
printf("%d\n", var[tc[pc + 1]]);
} else if (tc[pc + 1] == getTc(":", 1)) { // ラ...
pc += 2; // 何もしないで読み飛ばす.
continue;
} else if (tc[pc] == getTc("goto", 4) && tc[pc +...
pc = var[tc[pc + 1]];
continue;
} else if (tc[pc] == getTc("if", 2) && tc[pc + 1...
int gpc = var[tc[pc + 7]], v0 = var[tc[pc + ...
if (tc[pc + 3] == getTc("!=", 2) && v0 != v1...
if (tc[pc + 3] == getTc("==", 2) && v0 == v1...
if (tc[pc + 3] == getTc("<", 1) && v0 < v1...
} else if (tc[pc] == getTc("time", 4) && tc[pc +...
printf("time: %.3f[sec]\n", (clock() - t0) /...
} else if (tc[pc] == semi) {
// 何もしない.
} else
goto err;
while (tc[pc] != semi)
pc++;
pc++; // セミコロンを読み飛ばす.
}
return 0;
err:
printf("syntax error : %s %s %s %s\n", ts[tc[pc]], t...
return 1;
}
////////////////////////////////////////////////////////...
int main(int argc, const char **argv)
{
unsigned char txt[10000];
int i;
if (argc >= 2) { // コマンドライン引数あり.
if (loadText((String) argv[1], txt, 10000) == 0) {
run(txt);
}
exit(0);
}
for (;;) { // Read-Eval-Print Loop.
printf("\n>");
fgets(txt, 10000, stdin);
i = strlen(txt);
if (txt[i - 1] == '\n') { // 末尾に改行コードが...
txt[i - 1] = 0;
}
if (strncmp(txt, "run ", 4) == 0) { // runコマ...
if (loadText(&txt[4], txt, 10000) == 0) {
run(txt);
}
} else if (strcmp(txt, "exit") == 0) { // exitコ...
exit(0);
} else {
run(txt);
}
}
}
-HL-3と比較すると、まずloadText()をコマンドライン引数以外...
-また「;」だけの場合に何もしないという処理も追加しました...
-そしてコマンド入力で、末尾の「;」をよく忘れるのでrun()の...
-これらの改造により、実行すると以下のようになります。
C:\a21_txt01>hl4
>run hl3.txt ← HL-3用の1億回ループのプロ...
time: 73.984[sec]
>print i ← 実行後に、変数iの値を確認...
100000000 ← あっています。
>a=0; label: print a; a=a+1; if (a < 10) goto label; ← ...
0
1
2
3
4
5
6
7
8
9
>exit ← 終了コマンド。
c:\a21_txt01>
-私はとても楽しいです!
** (2) HL-4の補足説明
-関数:
--void loadText(String path, String t, int siz)
---ファイルパスpathで指定されたソースファイルをtに読み込...
--int getTc(String s, int len)
---トークン(単語)をsに渡すと、それに対応するトークンコ...
--int isAlphabetOrNumber(unsigned char c)
---引数で渡された文字コードが、英数字であれば1を返す。そ...
---アンダースコアもHL-4の中ではアルファベットということに...
---この関数は以下のlexer()の下請け。
--int lexer(String s, int tc[])
---sにプログラムのソースコードを渡す。すると、tc[]にトー...
---より詳しい動作は、[[a21_txt01_2a]]を参照のこと。
--int run(String s)
---言語処理の本体。HL-3までのmain()に相当。
--int main(int argc, const char **argv)
---REPLの処理をしている。
-変数:
--String ts[]
---getTc()が管理している配列変数で、トークンコードからト...
--int tl[]
---getTc()が管理している配列変数で、トークンコードからト...
--unsigned char tcBuf[]
---getTc()が管理している変数で、トークン文字列の実体を保...
--int tcs, tcb
---どちらもgetTc()が管理している変数で、tcsは今までに発行...
---tcbはtcBuf[]の未使用領域を指している。
---もしtcBuf[]やtcbの役割がピンとこない場合は、[[a21_txt0...
--int var[]
---変数の値を記憶しておくための変数。トークンコードをその...
--int tc[]
---プログラムをトークンコード列に変換したものがここに入る。
----
-説明するところはあまりないのですが、一応新しいloadText()...
--最初にしていることは、path[]からs[]を作ることです。
--もしダブルクォートが先頭についていたらそれを読み飛ばす...
--そしてダブルクォートもしくは文字コード0までをs[]にコピ...
--この処理によって「tl3.txt」と「"tl3.txt"」のどちらの書...
** 次回に続く
-次回: [[a21_txt01_5]]
*こめんと欄
#comment
終了行:
* 川合のプログラミング言語自作のためのテキスト第三版#4
-(by [[K]], 2021.03.01)
** (1) HL-4
-みなさんは「REPL」という言葉を知っているでしょうか。これ...
-これができるようになると、自作言語は見違えるほど魅力的に...
-ということで、HL-4ではそれをやってみようと思います。
#include <stdio.h>
#include <stdlib.h>
#include <string.h>
#include <time.h>
typedef unsigned char *String; // こう書くと String は u...
int loadText(String path, String t, int siz) // TL-1のと...
{
FILE *fp;
unsigned char s[1000];
int i = 0, j;
if (path[0] == 34) { i = 1; } // ダブルフォールトが...
for (j = 0; ; j++) {
if (path[i + j] == 0 || path[j + i] == 34)
break; // ファイル名の末尾に来たらそこで終わ...
s[j] = path[i + j];
}
s[j] = 0;
fp = fopen(s, "rt"); // テキストモードでファイルを開...
if (fp == 0) { // ファイルを開けなかった.
printf("fopen error : %s\n", path);
return 1; // 失敗.
}
i = fread(t, 1, siz - 1, fp);
fclose(fp);
t[i] = 0; // 終端マークを書いておく.
return 0; // 成功.
}
////////////////////////////////////////////////////////...
#define MAX_TC 255 // トークンコードの最大値.
String ts[MAX_TC + 1]; // トークンの内容(文字列)を記憶.
int tl[MAX_TC + 1]; // トークンの長さ.
unsigned char tcBuf[(MAX_TC + 1) * 10]; // トークン1つ当...
int tcs = 0, tcb = 0;
int var[MAX_TC + 1]; // 変数.
int getTc(String s, int len) → TL-2と同じなので省略
////////////////////////////////////////////////////////...
int isAlphabet(unsigned char c) → TL-2と同じなので省略
int lexer(String s, int tc[]) → TL-2と同じなので省略
int tc[10000]; // トークンコード.
////////////////////////////////////////////////////////...
int run(String s)
{
clock_t t0 = clock();
int pc, pc1;
pc1 = lexer(s, tc);
tc[pc1++] = getTc(";", 1); // 末尾に「;」を付け忘れ...
tc[pc1] = tc[pc1 + 1] = tc[pc1 + 2] = tc[pc1 + 3] = ...
int semi = getTc(";", 1);
for (pc = 0; pc < pc1; pc++) { // ラベル定義命令を探...
if (tc[pc + 1] == getTc(":", 1)) {
var[tc[pc]] = pc + 2; // ラベル定義命令の次...
}
}
for (pc = 0; pc < pc1;) { // プログラム実行開始.
if (tc[pc + 1] == getTc("=", 1) && tc[pc + 3] ==...
var[tc[pc]] = var[tc[pc + 2]];
} else if (tc[pc + 1] == getTc("=", 1) && tc[pc ...
var[tc[pc]] = var[tc[pc + 2]] + var[tc[pc + ...
} else if (tc[pc + 1] == getTc("=", 1) && tc[pc ...
var[tc[pc]] = var[tc[pc + 2]] - var[tc[pc + ...
} else if (tc[pc] == getTc("print", 5) && tc[pc ...
printf("%d\n", var[tc[pc + 1]]);
} else if (tc[pc + 1] == getTc(":", 1)) { // ラ...
pc += 2; // 何もしないで読み飛ばす.
continue;
} else if (tc[pc] == getTc("goto", 4) && tc[pc +...
pc = var[tc[pc + 1]];
continue;
} else if (tc[pc] == getTc("if", 2) && tc[pc + 1...
int gpc = var[tc[pc + 7]], v0 = var[tc[pc + ...
if (tc[pc + 3] == getTc("!=", 2) && v0 != v1...
if (tc[pc + 3] == getTc("==", 2) && v0 == v1...
if (tc[pc + 3] == getTc("<", 1) && v0 < v1...
} else if (tc[pc] == getTc("time", 4) && tc[pc +...
printf("time: %.3f[sec]\n", (clock() - t0) /...
} else if (tc[pc] == semi) {
// 何もしない.
} else
goto err;
while (tc[pc] != semi)
pc++;
pc++; // セミコロンを読み飛ばす.
}
return 0;
err:
printf("syntax error : %s %s %s %s\n", ts[tc[pc]], t...
return 1;
}
////////////////////////////////////////////////////////...
int main(int argc, const char **argv)
{
unsigned char txt[10000];
int i;
if (argc >= 2) { // コマンドライン引数あり.
if (loadText((String) argv[1], txt, 10000) == 0) {
run(txt);
}
exit(0);
}
for (;;) { // Read-Eval-Print Loop.
printf("\n>");
fgets(txt, 10000, stdin);
i = strlen(txt);
if (txt[i - 1] == '\n') { // 末尾に改行コードが...
txt[i - 1] = 0;
}
if (strncmp(txt, "run ", 4) == 0) { // runコマ...
if (loadText(&txt[4], txt, 10000) == 0) {
run(txt);
}
} else if (strcmp(txt, "exit") == 0) { // exitコ...
exit(0);
} else {
run(txt);
}
}
}
-HL-3と比較すると、まずloadText()をコマンドライン引数以外...
-また「;」だけの場合に何もしないという処理も追加しました...
-そしてコマンド入力で、末尾の「;」をよく忘れるのでrun()の...
-これらの改造により、実行すると以下のようになります。
C:\a21_txt01>hl4
>run hl3.txt ← HL-3用の1億回ループのプロ...
time: 73.984[sec]
>print i ← 実行後に、変数iの値を確認...
100000000 ← あっています。
>a=0; label: print a; a=a+1; if (a < 10) goto label; ← ...
0
1
2
3
4
5
6
7
8
9
>exit ← 終了コマンド。
c:\a21_txt01>
-私はとても楽しいです!
** (2) HL-4の補足説明
-関数:
--void loadText(String path, String t, int siz)
---ファイルパスpathで指定されたソースファイルをtに読み込...
--int getTc(String s, int len)
---トークン(単語)をsに渡すと、それに対応するトークンコ...
--int isAlphabetOrNumber(unsigned char c)
---引数で渡された文字コードが、英数字であれば1を返す。そ...
---アンダースコアもHL-4の中ではアルファベットということに...
---この関数は以下のlexer()の下請け。
--int lexer(String s, int tc[])
---sにプログラムのソースコードを渡す。すると、tc[]にトー...
---より詳しい動作は、[[a21_txt01_2a]]を参照のこと。
--int run(String s)
---言語処理の本体。HL-3までのmain()に相当。
--int main(int argc, const char **argv)
---REPLの処理をしている。
-変数:
--String ts[]
---getTc()が管理している配列変数で、トークンコードからト...
--int tl[]
---getTc()が管理している配列変数で、トークンコードからト...
--unsigned char tcBuf[]
---getTc()が管理している変数で、トークン文字列の実体を保...
--int tcs, tcb
---どちらもgetTc()が管理している変数で、tcsは今までに発行...
---tcbはtcBuf[]の未使用領域を指している。
---もしtcBuf[]やtcbの役割がピンとこない場合は、[[a21_txt0...
--int var[]
---変数の値を記憶しておくための変数。トークンコードをその...
--int tc[]
---プログラムをトークンコード列に変換したものがここに入る。
----
-説明するところはあまりないのですが、一応新しいloadText()...
--最初にしていることは、path[]からs[]を作ることです。
--もしダブルクォートが先頭についていたらそれを読み飛ばす...
--そしてダブルクォートもしくは文字コード0までをs[]にコピ...
--この処理によって「tl3.txt」と「"tl3.txt"」のどちらの書...
** 次回に続く
-次回: [[a21_txt01_5]]
*こめんと欄
#comment
ページ名: