a21_txt01_5
をテンプレートにして作成
[
トップ
] [
新規
|
一覧
|
単語検索
|
最終更新
|
ヘルプ
]
開始行:
* 川合のプログラミング言語自作のためのテキスト第三版#5
-(by [[K]], 2021.03.02)
** (1) HL-5
-さて、HL-3にしてもHL-4にしても、実行速度はあまり速くあり...
-このgetTc()はシンプルに作ってあるので、実行速度はかなり...
-実は一度getTc()したらもう値が変わることはないので、実行...
-ということで、最初の一回はgetTc()するけど、それ以降は値...
-また最初にlexer()を使うことで狙ったトークンに固定のトー...
#include <stdio.h>
#include <stdlib.h>
#include <string.h>
#include <time.h>
typedef unsigned char *String; // こう書くと String は u...
int loadText(String path, String t, int siz) → HL-4と同...
////////////////////////////////////////////////////////...
#define MAX_TC 255 // トークンコードの最大値.
String ts[MAX_TC + 1]; // トークンの内容(文字列)を記憶.
int tl[MAX_TC + 1]; // トークンの長さ.
unsigned char tcBuf[(MAX_TC + 1) * 10]; // トークン1つ当...
int tcs = 0, tcb = 0;
int var[MAX_TC + 1]; // 変数.
int getTc(String s, int len) → HL-4と同じなので省略
////////////////////////////////////////////////////////...
int isAlphabet(unsigned char c) → HL-2と同じなので省略
int lexer(String s, int tc[]) → HL-2と同じなので省略
int tc[10000]; // トークンコード.
enum { TcSemi = 0, TcDot, TcWiCard, Tc0, Tc1, Tc2, Tc3, ...
char tcInit[] = "; . !!* 0 1 2 3 4 5 6 7 8 == != < >= <=...
////////////////////////////////////////////////////////...
int phrCmp_tc[32 * 100], ppc1, wpc[9]; // ppc1:一致した...
int phrCmp(int pid, String phr, int pc)
{
int i0 = pid * 32, i, i1, j;
if (phrCmp_tc[i0 + 31] == 0) {
i1 = lexer(phr, &phrCmp_tc[i0]);
phrCmp_tc[i0 + 31] = i1;
}
i1 = phrCmp_tc[i0 + 31];
for (i = 0; i < i1; i++) {
if (phrCmp_tc[i0 + i] == TcWiCard) {
i++;
j = phrCmp_tc[i0 + i] - Tc0; // 後続の番号を...
wpc[j] = pc;
pc++;
continue;
}
if (phrCmp_tc[i0 + i] != tc[pc]) return 0; // マ...
pc++;
}
ppc1 = pc;
return 1; // マッチした.
}
////////////////////////////////////////////////////////...
int run(String s)
{
clock_t t0 = clock();
int pc, pc1;
pc1 = lexer(s, tc);
tc[pc1++] = TcSemi; // 末尾に「;」を付け忘れることが...
tc[pc1] = tc[pc1 + 1] = tc[pc1 + 2] = tc[pc1 + 3] = ...
for (pc = 0; pc < pc1; pc++) { // ラベル定義命令を探...
if (phrCmp( 0, "!!*0:", pc)) {
var[tc[pc]] = ppc1; // ラベル定義命令の次のp...
}
}
for (pc = 0; pc < pc1;) { // プログラム実行開始.
if (phrCmp( 1, "!!*0 = !!*1;", pc)) { // 単純代入.
var[tc[wpc[0]]] = var[tc[wpc[1]]];
} else if (phrCmp( 2, "!!*0 = !!*1 + !!*2;", pc)...
var[tc[wpc[0]]] = var[tc[wpc[1]]] + var[tc[w...
} else if (phrCmp( 3, "!!*0 = !!*1 - !!*2;", pc)...
var[tc[wpc[0]]] = var[tc[wpc[1]]] - var[tc[w...
} else if (phrCmp( 4, "print !!*0;", pc)) { // p...
printf("%d\n", var[tc[wpc[0]]]);
} else if (phrCmp( 0, "!!*0:", pc)) { // ラベル...
// 何もしない.
} else if (phrCmp( 5, "goto !!*0;", pc)) { // go...
pc = var[tc[wpc[0]]];
continue;
} else if (phrCmp( 6, "if (!!*0 !!*1 !!*2) goto ...
int gpc = var[tc[wpc[3]]], v0 = var[tc[wpc[0...
if (cc == TcEEq && v0 != v1) { pc = gpc; con...
if (cc == TcNEq && v0 == v1) { pc = gpc; con...
if (cc == TcLt && v0 < v1) { pc = gpc; con...
} else if (phrCmp( 7, "time;", pc)) {
printf("time: %.3f[sec]\n", (clock() - t0) /...
} else if (phrCmp( 8, ";", pc)) {
// 何もしない.
} else
goto err;
pc = ppc1;
}
return 0;
err:
printf("syntax error : %s %s %s %s\n", ts[tc[pc]], t...
return 1;
}
////////////////////////////////////////////////////////...
int main(int argc, const char **argv)
{
unsigned char txt[10000];
int i;
+ lexer(tcInit, tc);
if (argc >= 2) {
if (loadText((String) argv[1], txt, 10000) == 0) {
run(txt);
}
exit(0);
}
for (;;) { // Read-Eval-Print Loop.
printf("\n>");
fgets(txt, 10000, stdin);
i = strlen(txt);
if (txt[i - 1] == '\n') { // 末尾に改行コードが...
txt[i - 1] = 0;
}
if (strncmp(txt, "run ", 4) == 0) {
if (loadText(&txt[4], txt, 10000) == 0) {
run(txt);
}
} else if (strcmp(txt, "exit") == 0) {
exit(0);
} else {
run(txt);
}
}
}
** (2) HL-5の簡単な説明
-関数:
--void loadText(String path, String t, int siz)
---ファイルパスpathで指定されたソースファイルをtに読み込...
--int getTc(String s, int len)
---トークン(単語)をsに渡すと、それに対応するトークンコ...
--int isAlphabetOrNumber(unsigned char c)
---引数で渡された文字コードが、英数字であれば1を返す。そ...
---アンダースコアもHL-5の中ではアルファベットということに...
---この関数は以下のlexer()の下請け。
--int lexer(String s, int tc[])
---sにプログラムのソースコードを渡す。すると、tc[]にトー...
---より詳しい動作は、[[a21_txt01_2a]]を参照のこと。
--int phrCmp(int pid, String phr, int pc)
---tc[pc]からのトークンコード列がphrで指定されたトークン...
---pidはフレーズIDで、この番号を使ってphrCmp_tc[]のどこに...
---なお、処理できるフレーズの最大長はこのプログラムの場合...
--int run(String s)
---言語処理の本体。HL-3までのmain()に相当。
--int main(int argc, const char **argv)
---REPLの処理をしている。
-変数:
--String ts[]
---getTc()が管理している配列変数で、トークンコードからト...
--int tl[]
---getTc()が管理している配列変数で、トークンコードからト...
--unsigned char tcBuf[]
---getTc()が管理している変数で、トークン文字列の実体を保...
--int tcs, tcb
---どちらもgetTc()が管理している変数で、tcsは今までに発行...
---tcbはtcBuf[]の未使用領域を指している。
---もしtcBuf[]やtcbの役割がピンとこない場合は、[[a21_txt0...
--int var[]
---変数の値を記憶しておくための変数。トークンコードをその...
--int tc[]
---プログラムをトークンコード列に変換したものがここに入る。
--int phrCmp_tc[]
---phrCmp()が管理している変数で、phrCmp_tc[]にはフレーズ...
--int ppc1, wpc[]
---フレーズが一致した場合、ppc1に一致したフレーズの次のト...
---wpc[]にはワイルドカードで一致した位置が入る。
----
-要点は、run()の中の「プログラム実行開始」以降は、getTc()...
-これはphrase-compareのつもりなのですが、つまり複数のトー...
--以下を比べてみてください。
[HL-4] } else if (tc[pc] == getTc("if", 2) && tc[pc + 1]...
[HL-5] } else if (phrCmp( 6, "if (!!*0 !!*1 !!*2) goto !...
--どちらが読みやすいでしょうか。もちろんphrCmp()のほうで...
--(実際のHL-5では「 && TcEEq <= tc[wpc[1]] && tc[wpc[1]]...
-ということでphrCmp()関数について説明します。
--phrCmp()は最初に呼ばれたとき、渡されたフレーズをlexer()...
--これは最初の一回だけしかやらないので、実行時間にはほと...
--そしてプログラム中のトークンコード列と、phrCmp_tc[]を比...
--なお、「!!*」は特別なトークンで、これがあるとその場所に...
--wpc[]が使えるようになったことで、プログラムはこんな感じ...
[HL-4]
} else if (tc[pc + 1] == getTc("=", 1) && tc[pc ...
var[tc[pc]] = var[tc[pc + 2]] + var[tc[pc + ...
[HL-5]
} else if (phrCmp( 2, "!!*0 = !!*1 + !!*2;", pc)...
var[tc[wpc[0]]] = var[tc[wpc[1]]] + var[tc[w...
--if文の条件節の部分はphrCmpのほうが読みやすいのは自明だ...
--今のところ、1フレーズ当たり最大31トークンとして、100フ...
--さてこれによってどのくらい速くなったでしょうか。
--こちらの環境で試したときには約6倍くらい高速になりました。
-もう一つのテクニックとして、以下のenumとtcInitがあります。
enum { TcSemi = 0, TcDot, TcWiCard, Tc0, Tc1, Tc2, Tc3, ...
char tcInit[] = "; . !!* 0 1 2 3 4 5 6 7 8 == != < >= <=...
-これはmain()関数の最初で、tcInitをlexer()することで、ト...
-これで一番得をしているのは、0~8が確実に連番になることと...
-連番になっているとわかっているからこそ、「TcEEq <= tc[wp...
-連番になっているからこそ、「j = phrCmp_tc[i0 + i] - Tc0;...
-(余談ですが、私は「a <= x && x <= b」という書き方が好き...
-なお、HL-5では6つの比較演算子のトークンコードを決めてお...
** 次回に続く
-次回: [[a21_txt01_6]]
*こめんと欄
#comment
終了行:
* 川合のプログラミング言語自作のためのテキスト第三版#5
-(by [[K]], 2021.03.02)
** (1) HL-5
-さて、HL-3にしてもHL-4にしても、実行速度はあまり速くあり...
-このgetTc()はシンプルに作ってあるので、実行速度はかなり...
-実は一度getTc()したらもう値が変わることはないので、実行...
-ということで、最初の一回はgetTc()するけど、それ以降は値...
-また最初にlexer()を使うことで狙ったトークンに固定のトー...
#include <stdio.h>
#include <stdlib.h>
#include <string.h>
#include <time.h>
typedef unsigned char *String; // こう書くと String は u...
int loadText(String path, String t, int siz) → HL-4と同...
////////////////////////////////////////////////////////...
#define MAX_TC 255 // トークンコードの最大値.
String ts[MAX_TC + 1]; // トークンの内容(文字列)を記憶.
int tl[MAX_TC + 1]; // トークンの長さ.
unsigned char tcBuf[(MAX_TC + 1) * 10]; // トークン1つ当...
int tcs = 0, tcb = 0;
int var[MAX_TC + 1]; // 変数.
int getTc(String s, int len) → HL-4と同じなので省略
////////////////////////////////////////////////////////...
int isAlphabet(unsigned char c) → HL-2と同じなので省略
int lexer(String s, int tc[]) → HL-2と同じなので省略
int tc[10000]; // トークンコード.
enum { TcSemi = 0, TcDot, TcWiCard, Tc0, Tc1, Tc2, Tc3, ...
char tcInit[] = "; . !!* 0 1 2 3 4 5 6 7 8 == != < >= <=...
////////////////////////////////////////////////////////...
int phrCmp_tc[32 * 100], ppc1, wpc[9]; // ppc1:一致した...
int phrCmp(int pid, String phr, int pc)
{
int i0 = pid * 32, i, i1, j;
if (phrCmp_tc[i0 + 31] == 0) {
i1 = lexer(phr, &phrCmp_tc[i0]);
phrCmp_tc[i0 + 31] = i1;
}
i1 = phrCmp_tc[i0 + 31];
for (i = 0; i < i1; i++) {
if (phrCmp_tc[i0 + i] == TcWiCard) {
i++;
j = phrCmp_tc[i0 + i] - Tc0; // 後続の番号を...
wpc[j] = pc;
pc++;
continue;
}
if (phrCmp_tc[i0 + i] != tc[pc]) return 0; // マ...
pc++;
}
ppc1 = pc;
return 1; // マッチした.
}
////////////////////////////////////////////////////////...
int run(String s)
{
clock_t t0 = clock();
int pc, pc1;
pc1 = lexer(s, tc);
tc[pc1++] = TcSemi; // 末尾に「;」を付け忘れることが...
tc[pc1] = tc[pc1 + 1] = tc[pc1 + 2] = tc[pc1 + 3] = ...
for (pc = 0; pc < pc1; pc++) { // ラベル定義命令を探...
if (phrCmp( 0, "!!*0:", pc)) {
var[tc[pc]] = ppc1; // ラベル定義命令の次のp...
}
}
for (pc = 0; pc < pc1;) { // プログラム実行開始.
if (phrCmp( 1, "!!*0 = !!*1;", pc)) { // 単純代入.
var[tc[wpc[0]]] = var[tc[wpc[1]]];
} else if (phrCmp( 2, "!!*0 = !!*1 + !!*2;", pc)...
var[tc[wpc[0]]] = var[tc[wpc[1]]] + var[tc[w...
} else if (phrCmp( 3, "!!*0 = !!*1 - !!*2;", pc)...
var[tc[wpc[0]]] = var[tc[wpc[1]]] - var[tc[w...
} else if (phrCmp( 4, "print !!*0;", pc)) { // p...
printf("%d\n", var[tc[wpc[0]]]);
} else if (phrCmp( 0, "!!*0:", pc)) { // ラベル...
// 何もしない.
} else if (phrCmp( 5, "goto !!*0;", pc)) { // go...
pc = var[tc[wpc[0]]];
continue;
} else if (phrCmp( 6, "if (!!*0 !!*1 !!*2) goto ...
int gpc = var[tc[wpc[3]]], v0 = var[tc[wpc[0...
if (cc == TcEEq && v0 != v1) { pc = gpc; con...
if (cc == TcNEq && v0 == v1) { pc = gpc; con...
if (cc == TcLt && v0 < v1) { pc = gpc; con...
} else if (phrCmp( 7, "time;", pc)) {
printf("time: %.3f[sec]\n", (clock() - t0) /...
} else if (phrCmp( 8, ";", pc)) {
// 何もしない.
} else
goto err;
pc = ppc1;
}
return 0;
err:
printf("syntax error : %s %s %s %s\n", ts[tc[pc]], t...
return 1;
}
////////////////////////////////////////////////////////...
int main(int argc, const char **argv)
{
unsigned char txt[10000];
int i;
+ lexer(tcInit, tc);
if (argc >= 2) {
if (loadText((String) argv[1], txt, 10000) == 0) {
run(txt);
}
exit(0);
}
for (;;) { // Read-Eval-Print Loop.
printf("\n>");
fgets(txt, 10000, stdin);
i = strlen(txt);
if (txt[i - 1] == '\n') { // 末尾に改行コードが...
txt[i - 1] = 0;
}
if (strncmp(txt, "run ", 4) == 0) {
if (loadText(&txt[4], txt, 10000) == 0) {
run(txt);
}
} else if (strcmp(txt, "exit") == 0) {
exit(0);
} else {
run(txt);
}
}
}
** (2) HL-5の簡単な説明
-関数:
--void loadText(String path, String t, int siz)
---ファイルパスpathで指定されたソースファイルをtに読み込...
--int getTc(String s, int len)
---トークン(単語)をsに渡すと、それに対応するトークンコ...
--int isAlphabetOrNumber(unsigned char c)
---引数で渡された文字コードが、英数字であれば1を返す。そ...
---アンダースコアもHL-5の中ではアルファベットということに...
---この関数は以下のlexer()の下請け。
--int lexer(String s, int tc[])
---sにプログラムのソースコードを渡す。すると、tc[]にトー...
---より詳しい動作は、[[a21_txt01_2a]]を参照のこと。
--int phrCmp(int pid, String phr, int pc)
---tc[pc]からのトークンコード列がphrで指定されたトークン...
---pidはフレーズIDで、この番号を使ってphrCmp_tc[]のどこに...
---なお、処理できるフレーズの最大長はこのプログラムの場合...
--int run(String s)
---言語処理の本体。HL-3までのmain()に相当。
--int main(int argc, const char **argv)
---REPLの処理をしている。
-変数:
--String ts[]
---getTc()が管理している配列変数で、トークンコードからト...
--int tl[]
---getTc()が管理している配列変数で、トークンコードからト...
--unsigned char tcBuf[]
---getTc()が管理している変数で、トークン文字列の実体を保...
--int tcs, tcb
---どちらもgetTc()が管理している変数で、tcsは今までに発行...
---tcbはtcBuf[]の未使用領域を指している。
---もしtcBuf[]やtcbの役割がピンとこない場合は、[[a21_txt0...
--int var[]
---変数の値を記憶しておくための変数。トークンコードをその...
--int tc[]
---プログラムをトークンコード列に変換したものがここに入る。
--int phrCmp_tc[]
---phrCmp()が管理している変数で、phrCmp_tc[]にはフレーズ...
--int ppc1, wpc[]
---フレーズが一致した場合、ppc1に一致したフレーズの次のト...
---wpc[]にはワイルドカードで一致した位置が入る。
----
-要点は、run()の中の「プログラム実行開始」以降は、getTc()...
-これはphrase-compareのつもりなのですが、つまり複数のトー...
--以下を比べてみてください。
[HL-4] } else if (tc[pc] == getTc("if", 2) && tc[pc + 1]...
[HL-5] } else if (phrCmp( 6, "if (!!*0 !!*1 !!*2) goto !...
--どちらが読みやすいでしょうか。もちろんphrCmp()のほうで...
--(実際のHL-5では「 && TcEEq <= tc[wpc[1]] && tc[wpc[1]]...
-ということでphrCmp()関数について説明します。
--phrCmp()は最初に呼ばれたとき、渡されたフレーズをlexer()...
--これは最初の一回だけしかやらないので、実行時間にはほと...
--そしてプログラム中のトークンコード列と、phrCmp_tc[]を比...
--なお、「!!*」は特別なトークンで、これがあるとその場所に...
--wpc[]が使えるようになったことで、プログラムはこんな感じ...
[HL-4]
} else if (tc[pc + 1] == getTc("=", 1) && tc[pc ...
var[tc[pc]] = var[tc[pc + 2]] + var[tc[pc + ...
[HL-5]
} else if (phrCmp( 2, "!!*0 = !!*1 + !!*2;", pc)...
var[tc[wpc[0]]] = var[tc[wpc[1]]] + var[tc[w...
--if文の条件節の部分はphrCmpのほうが読みやすいのは自明だ...
--今のところ、1フレーズ当たり最大31トークンとして、100フ...
--さてこれによってどのくらい速くなったでしょうか。
--こちらの環境で試したときには約6倍くらい高速になりました。
-もう一つのテクニックとして、以下のenumとtcInitがあります。
enum { TcSemi = 0, TcDot, TcWiCard, Tc0, Tc1, Tc2, Tc3, ...
char tcInit[] = "; . !!* 0 1 2 3 4 5 6 7 8 == != < >= <=...
-これはmain()関数の最初で、tcInitをlexer()することで、ト...
-これで一番得をしているのは、0~8が確実に連番になることと...
-連番になっているとわかっているからこそ、「TcEEq <= tc[wp...
-連番になっているからこそ、「j = phrCmp_tc[i0 + i] - Tc0;...
-(余談ですが、私は「a <= x && x <= b」という書き方が好き...
-なお、HL-5では6つの比較演算子のトークンコードを決めてお...
** 次回に続く
-次回: [[a21_txt01_6]]
*こめんと欄
#comment
ページ名: