TL-2のさらなるコンパクト化
(1)
- tl1cでTL-1を13行も削減したわけですが、ではTL-2はもっと短く高速にできないのでしょうか。・・・もちろんできます。
- 手法としては基本的に同じで、たとえば「18」という文字列も18という定数を意味するのではなく、18という初期値が入った変数だとみなします。そのほか、区別するのが面倒ですし特に大きな問題もないので、「+」や「;」や「print」なども変数にしてしまいます。ただしこれらは正常なプログラムを実行している限りにおいては一度も参照されません。
- text0002では、様々な文字種を自由に設定したり変更できたりするために、isNumber()、isAlphabet()、isSymbol()、isSymbol1()を定義して使ってきましたが、この仕様だと行数を食うので、isAlphabet()を除いて残りすべてはlexer()内に展開してしまいました。
- これにより、TL-2cは101行まで削減されます。
- ここまでのまとめ:
| オリジナル | コンパクト版(c) |
TL-1 | 65行 | 52行 |
TL-2 | 137行 | 101行 |
#include <stdio.h>
#include <stdlib.h>
#include <string.h>
typedef unsigned char *String; // こう書くと String は unsigned char * の代用になる.
void loadText(int argc, const char **argv, unsigned char *t, int siz) → TL-1と同じなので省略
int isAlphabet(unsigned char c) // 変数名の一文字目に使える文字かどうか.
{
if ('a' <= c && c <= 'z') return 1;
if ('A' <= c && c <= 'Z') return 1;
if (c == '_') return 1;
return 0;
}
int lexer(String s, String b, String t[]) // プログラムを単語(トークン)に切り分ける.
{
int i = 0, j = 0, k = 0;
while (s[i] != 0) {
if (s[i] == ' ' || s[i] == '\t' || s[i] == '\n') { // スペース、タブ、改行.
i++;
continue;
}
t[k++] = &b[j]; // 単語の先頭を登録.
if (strchr("(){}[];,", s[i]) != 0) { // 1文字記号.
b[j++] = s[i++];
} else if ('0' <= s[i] && s[i] <= '9') { // 1文字目が数字.
while ('0' <= s[i] && s[i] <= '9')
b[j++] = s[i++];
} else if (isAlphabet(s[i]) != 0) { // 1文字目が英字.
while (isAlphabet(s[i]) != 0 || ('0' <= s[i] && s[i] <= '9'))
b[j++] = s[i++];
} else if (strchr("=+-*/!%&~|<>?:.", s[i]) != 0) { // 1文字目が普通の記号.
while (strchr("=+-*/!%&~|<>?:.", s[i]) != 0)
b[j++] = s[i++];
} else {
printf("syntax error : %.10s\n", &s[i]);
exit(1);
}
b[j++] = 0; // 単語の終端マーク.
}
return k;
}
int main(int argc, const char **argv)
{
int i, vars = 0, pc, pc1, var[256], varNum[1000]; // 変数と変数番号.
String t[1000], varName[256]; // トークンと変数名.
unsigned char txt[10000], buf[10000]; // ソースコードとトークン用のバッファ.
loadText(argc, argv, txt, 10000);
pc1 = lexer(txt, buf, t);
t[pc1] = t[pc1 + 1] = t[pc1 + 2] = t[pc1 + 3] = ""; // エラー表示用のために末尾にいくつか長さ0の文字列を登録しておく.
for (pc = 0; pc < pc1; pc++) {
for (i = 0; i < vars; i++) { // 登録済みの中から探す.
if (strcmp(t[pc], varName[i]) == 0) break;
}
varNum[pc] = i;
if (i < vars) continue;
varName[i] = t[pc]; // 見つからなかったので新規登録.
var[i] = strtol(t[pc], 0, 0); // 初期値を設定.
vars++;
}
for (pc = 0; pc < pc1; pc++) {
if (strcmp(t[pc + 1], "=") == 0) { // 2単語目が"=".
if (strcmp(t[pc + 3], ";") == 0) { // 単純代入.
var[varNum[pc]] = var[varNum[pc + 2]];
} else if (strcmp(t[pc + 3], "+") == 0 && strcmp(t[pc + 5], ";") == 0) { // 加算.
var[varNum[pc]] = var[varNum[pc + 2]] + var[varNum[pc + 4]];
} else if (strcmp(t[pc + 3], "-") == 0 && strcmp(t[pc + 5], ";") == 0) { // 減算.
var[varNum[pc]] = var[varNum[pc + 2]] - var[varNum[pc + 4]];
} else
goto err;
} else if (strcmp(t[pc], "print") == 0 && strcmp(t[pc + 2], ";") == 0) { // print.
printf("%d\n", var[varNum[pc + 1]]);
} else
goto err;
while (strcmp(t[pc], ";") != 0)
pc++;
}
exit(0);
err:
printf("syntax error : %s %s %s %s\n", t[pc], t[pc + 1], t[pc + 2], t[pc + 3]);
exit(1);
}
こめんと欄