a21_txt01_8
の編集
https://essen.osask.jp/?a21_txt01_8
[
トップ
] [
編集
|
差分
|
バックアップ
|
添付
|
リロード
] [
新規
|
一覧
|
単語検索
|
最終更新
|
ヘルプ
]
-- 雛形とするページ --
BracketName
EssenRev4
FormattingRules
FrontPage
Help
InterWiki
InterWikiName
InterWikiSandBox
K
MenuBar
PHP
PukiWiki
PukiWiki/1.4
PukiWiki/1.4/Manual
PukiWiki/1.4/Manual/Plugin
PukiWiki/1.4/Manual/Plugin/A-D
PukiWiki/1.4/Manual/Plugin/E-G
PukiWiki/1.4/Manual/Plugin/H-K
PukiWiki/1.4/Manual/Plugin/L-N
PukiWiki/1.4/Manual/Plugin/O-R
PukiWiki/1.4/Manual/Plugin/S-U
PukiWiki/1.4/Manual/Plugin/V-Z
RecentDeleted
SDL2_01
SandBox
WikiEngines
WikiName
WikiWikiWeb
YukiWiki
a21
a21_acl01
a21_bbs01
a21_challengers
a21_count
a21_edu01
a21_edu02
a21_edu03
a21_edu04
a21_edu05
a21_edu06
a21_edu07
a21_edu08
a21_edu09
a21_edu10
a21_edu11
a21_hlx000
a21_hlx001
a21_hlx001_1
a21_hlx001_2
a21_hlx001_3
a21_hlx002
a21_hlx002_1
a21_hlx003
a21_hlx003_1
a21_hlx004_1
a21_memo01
a21_opt
a21_opt02
a21_opt03
a21_p01
a21_special
a21_tl9a
a21_todo
a21_txt01
a21_txt01_10
a21_txt01_1a
a21_txt01_2
a21_txt01_2a
a21_txt01_2b
a21_txt01_3
a21_txt01_4
a21_txt01_5
a21_txt01_6
a21_txt01_6a
a21_txt01_7
a21_txt01_8
a21_txt01_8a
a21_txt01_9
a21_txt01_9a
a21_txt02
a21_txt02_10
a21_txt02_10a
a21_txt02_10b
a21_txt02_11
a21_txt02_11a
a21_txt02_12
a21_txt02_12a
a21_txt02_12b
a21_txt02_1a
a21_txt02_1b
a21_txt02_2
a21_txt02_2a
a21_txt02_3
a21_txt02_3a
a21_txt02_4
a21_txt02_4a
a21_txt02_5
a21_txt02_5a
a21_txt02_6
a21_txt02_6a
a21_txt02_6b
a21_txt02_6b_rev0
a21_txt02_6x
a21_txt02_7
a21_txt02_7a
a21_txt02_8
a21_txt02_8a
a21_txt02_9
a21_txt02_9a
a22_acl2_01
a22_acl2_02
a22_edu12
a22_intro01
a22_intro02
a22_intro03
a22_memman01
a22_memman02
a22_memman03
a22_memman04
a22_memman05
a22_memman06
a22_memman07
a22_memo01
a22_mingw_debug
a22_txt03
a22_txt03_1a
a22_txt03_1b
a22_txt03_2
a22_txt03_2a
a22_ufcs01
a23_bbs
a23_ec001
a23_ec002
a23_intro00
a23_intro000
a23_intro01
a23_intro02
a23_intro03
a23_intro04
a23_intro05
a23_intro06
a23_intro07
a23_intro08
a23_intro09
a23_intro10
a23_intro10wk1
a23_intro10wk2
a23_intro10wk3
a23_intro11
a23_intro12
a23_intro13
a23_intro13wk1
a23_intro14
a23_intro15
a23_intro16
a23_intro17
a23_intro17wk1
a23_intro18
a23_intro19
a23_intro90
a23_intro91
a23_neopixel1
a23_os01
a23_useSelfMade
a23_usm001
a23_usm002
a23_usm003
a23_usm004
a23_usm005
a23_usm006
a23_usm007
a23_usm008
a23_usm009
a24_AMap11
a24_AMapSim11
a24_AMemFile
a24_AMemMan
a24_aErrExit
a24_aFnv
a24_aOsFunc
a24_aQSort
a24_aXorShift32
a24_acl1T_doc01
a24_acl1Tiny
a24_acpp0
a24_buntan01
a24_cMin
a24_getTyp
a24_goodvalues
a24_idea001
a24_longdef
a24_memo01
a24_memo02
a24_osc20240310
a24_osc20241026
a24_picoLcd13
a24_picoTrain1
a24_programs
a24_raspberrypi01
a24_raspberrypi02
a24_schedule
a24_spc2tab
a24_tab2spc
a24_useSelfMade
a25_acl3
a25_buntan02
a25_buntan03
a25_buntan04
a25_buntan05
a25_kcas01
a25_kharc01
a25_kharc02
a25_kharc03
a25_kharc04
a25_kharc05
a25_kharc06
a25_kharcs1
a25_kharcs2
a25_kharcs3
a25_kharcs4
a25_kharcs5
a25_kharcs6
a25_kharcs7
a25_kharcs8
a25_kharcs9
aclib00
aclib01
aclib02
aclib03
aclib04
aclib05
aclib06
aclib07
aclib08
aclib09
aclib10
aclib11
aclib12
aclib13
aclib14
aclib15
aclib16
aclib17
aclib18
aclib19
aclib20
aclib21
aclib22
aclib23
aclib24
aclib25
aclib_bbs
arm64_01
avm0001
edu0001
edu0002
edu0003
esb02b_hrb
esb_dbg
esbasic0001
esbasic0002
esbasic0003
esbasic0004
esbasic0005
esbasic0006
esbasic0007
esbasic0008
esbasic0009
esbasic0010
esbasic0011
esbasic0012
esbasic0013
esbasic0014
esbasic0015
esbasic0016
esbasic0017
esbasic02a
esc0001
escm0001
essen_hist
esvm0001
esvm0002
esvm0003
esvm0004
esvm0005
esvm0006
esvm_i0
hh4a
idea0001
idea0002
idea0003
impressions
jck_0000
jck_0001
kawai
kbcl0_0000
kbcl0_0001
kbcl0_0002
kbcl0_0003
kbcl0_0004
kbcl0_0005
kbcl0_0006
kbcl0_0007
kclib1_0000
kclib1_0001
kclib1_0002
kclib1_0003
kclib1_0004
kclib1_0005
kclib1_0006
kclib1_0007
kclib1_0008
kclib1_0009
kclib1_0010
kpap0001
members
memo0001
osask4g
osask4g_r2
p20200311a
p20200610a
p20200610b
p20200624a
p20200711a
p20200716a
p20250813a
p20250813b
p20250813c
p20250815a
p20250903a
p20251006a
page0001
page0002
page0003
page0004
page0005
page0006
page0007
page0008
page0009
page0010
page0011
page0012
page0013
page0014
page0015
page0016
page0017
page0018
page0019
page0020
page0021
page0022
page0023
populars
seccamp
seccamp2019
sechack
sechack2019
seclang01
sh3_2020
sh3_2020_kw
sh3_2020_nk
sh3_2021_kw
sh3_2021_nk
sh3_2022_kw
sh3_2023_kw
sh3_2024_kw
sh3_2025_kw
sh3_kw_hist
termux001
termux002
text0001
text0001a
text0002
text0002a
text0003
text0004
text0005
text0006
text0006a
text0007
text0008
text0010
text0011
text0012
text0013
text0014
text0015
text0016
text0017
text0018
text0019
text0020
text0021
tl1c
tl2c
tl3c
tl3d
* 川合のプログラミング言語自作のためのテキスト第三版#8 -(by [[K]], 2021.03.13) ** (1) HL-8 -今回は、ブロックifとfor文を追加します。 #include <stdio.h> #include <stdlib.h> #include <string.h> #include <time.h> typedef unsigned char *String; // こう書くと String は unsigned char * の代用になる. int loadText(String path, String t, int siz) → HL-4と同じなので省略 /////////////////////////////////////////////////////////////////////////////// #define MAX_TC 1000 // トークンコードの最大値. String ts[MAX_TC + 1]; // トークンの内容(文字列)を記憶. int tl[MAX_TC + 1]; // トークンの長さ. unsigned char tcBuf[(MAX_TC + 1) * 10]; // トークン1つ当たり平均10バイトを想定. int tcs = 0, tcb = 0; int var[MAX_TC + 1]; // 変数. int getTc(String s, int len) → HL-4と同じなので省略 /////////////////////////////////////////////////////////////////////////////// int isAlphabetOrNumber(unsigned char c) → HL-2と同じなので省略 int lexer(String s, int tc[]) → HL-2と同じなので省略 int tc[10000]; // トークンコード. enum { TcSemi = 0, TcDot, TcWiCard, Tc0, Tc1, Tc2, Tc3, Tc4, Tc5, Tc6, Tc7, Tc8, TcBrOpn, TcBrCls, TcSqBrOpn, TcSqBrCls, TcCrBrOpn, TcCrBrCls, TcEEq, TcNEq, TcLt, TcGe, TcLe, TcGt, TcPlus, TcMinus, TcAster, TcSlash, TcPerce, TcAnd, TcShr, TcPlPlus, TcEqu, TcComma, TcExpr, TcExpr0, TcTmp0, TcTmp1, TcTmp2, TcTmp3, TcTmp4, TcTmp5, TcTmp6, TcTmp7, TcTmp8, TcTmp9 }; char tcInit[] = "; . !!* 0 1 2 3 4 5 6 7 8 ( ) [ ] { } == != < >= <= > + - * / % & >> ++ = , !!** !!*** _t0 _t1 _t2 _t3 _t4 _t5 _t6 _t7 _t8 _t9"; /////////////////////////////////////////////////////////////////////////////// int phrCmp_tc[32 * 100], ppc1, wpc[9], wpc1[9]; // ppc1:一致したフレーズの次のトークンをさす, wpc[]:ワイルドカードのトークンの場所をさす. int phrCmp(int pid, String phr, int pc) → HL-7と同じなので省略 /////////////////////////////////////////////////////////////////////////////// typedef int *IntP; // こう書くと IntP は int * の代わりに使えるようになる. enum { OpCpy = 0, OpCeq, OpCne, OpClt, OpCge, OpCle, OpCgt, OpAdd, OpSub, OpMul, OpDiv, OpMod, OpAnd, OpShr, OpAdd1, OpNeg, OpGoto, OpJeq, OpJne, OpJlt, OpJge, OpJle, OpJgt, OpLop, OpPrint, OpTime, OpEnd }; IntP ic[10000], *icq; // ic[]:内部コード、icq:ic[]への書き込み用ポインタ. void putIc(int op, IntP p0, IntP p1, IntP p2, IntP p3) → HL-6と同じなので省略 /////////////////////////////////////////////////////////////////////////////// char tmp_flag[10]; // 一時変数の利用状況を管理. int tmpAlloc() → HL-7と同じなので省略 void tmpFree(int i) → HL-7と同じなので省略 /////////////////////////////////////////////////////////////////////////////// int epc, epc1; // exprのためのpcとpc1. int exprSub(int priority); // exprSub1()が参照するので、プロトタイプ宣言. int expr(int j); int exprSub1(int i, int priority, int op) → HL-7と同じなので省略 int exprSub(int priority) → HL-7と同じなので省略 int expr(int j) → HL-7と同じなので省略 /////////////////////////////////////////////////////////////////////////////// → ここから下は全部HL-8で新規追加(ここより上は一切変化なし) enum { IfTrue = 0, IfFalse = 1 }; void ifgoto(int i, int not, int label) { int j = wpc[i]; if (j + 3 == wpc1[i] && TcEEq <= tc[j + 1] && tc[j + 1] <= TcGt) { // 条件式の長さが3トークンで、真ん中が比較演算子だったら. putIc(((tc[j + 1] - TcEEq) ^ not) + OpJeq, &var[label], &var[tc[j]], &var[tc[j + 2]], 0); } else { i = expr(i); putIc(OpJne - not, &var[label], &var[i], &var[Tc0], 0); tmpFree(i); } } int tmpLabelNo; int tmpLabelAlloc() { char s[10]; sprintf(s, "_l%d", tmpLabelNo); tmpLabelNo++; return getTc(s, strlen(s)); } #define BInfSiz 10 int binf[BInfSiz * 100], bd, lbd; // binf:block-info, bd:block-depth, lbd:loop-block-depth enum { BlkIf = 1, BlkFor }; enum { IfLabel0 = 1, IfLabel1 }; enum { ForLopBgn = 1, ForCont, ForBrk, ForLbd0, ForWpc01, ForWpc11, ForWpc02, ForWpc12 }; /////////////////////////////////////////////////////////////////////////////// → HL-8での新規追加の範囲終了 int compile(String s) { ! int pc, pc1, i, j; ! IntP *icq1, *icp; pc1 = lexer(s, tc); tc[pc1++] = TcSemi; // 末尾に「;」を付け忘れることが多いので、付けてあげる. tc[pc1] = tc[pc1 + 1] = tc[pc1 + 2] = tc[pc1 + 3] = TcDot; // エラー表示用のために末尾にピリオドを登録しておく. icq = ic; for (i = 0; i < 10; i++) { ・// 一時変数をすべて未使用にする. tmp_flag[i] = 0; } + tmpLabelNo = 0; + bd = lbd = 0; for (pc = 0; pc < pc1; ) { // コンパイル開始. ! int e0 = 0, e2 = 0; if (phrCmp( 1, "!!*0 = !!*1;", pc)) { // 単純代入. putIc(OpCpy, &var[tc[wpc[0]]], &var[tc[wpc[1]]], 0, 0); } else if (phrCmp(10, "!!*0 = !!*1 + 1; if (!!*2 < !!*3) goto !!*4;", pc) && tc[wpc[0]] == tc[wpc[1]] && tc[wpc[0]] == tc[wpc[2]]) { putIc(OpLop, &var[tc[wpc[4]]], &var[tc[wpc[0]]], &var[tc[wpc[3]]], 0); } else if (phrCmp( 9, "!!*0 = !!*1 + 1;", pc) && tc[wpc[0]] == tc[wpc[1]]) { // 高速化のために+1専用の命令を用意(せこくてすみません). putIc(OpAdd1, &var[tc[wpc[0]]], 0, 0, 0); } else if (phrCmp( 2, "!!*0 = !!*1 + !!*2;", pc)) { // 加算. putIc(OpAdd, &var[tc[wpc[0]]], &var[tc[wpc[1]]], &var[tc[wpc[2]]], 0); } else if (phrCmp( 3, "!!*0 = !!*1 - !!*2;", pc)) { // 減算. putIc(OpSub, &var[tc[wpc[0]]], &var[tc[wpc[1]]], &var[tc[wpc[2]]], 0); } else if (phrCmp( 4, "print !!**0;", pc)) { // print. e0 = expr(0); putIc(OpPrint, &var[e0], 0, 0, 0); } else if (phrCmp( 0, "!!*0:", pc)) { // ラベル定義命令. var[tc[wpc[0]]] = icq - ic; // ラベルに対応するicqを記録しておく. } else if (phrCmp( 5, "goto !!*0;", pc)) { // goto. ! putIc(OpGoto, &var[tc[wpc[0]]], &var[tc[wpc[0]]], 0, 0); // OpGotoの仕様変更. ! } else if (phrCmp( 6, "if (!!**0) goto !!*1;", pc)) { ! ifgoto(0, IfTrue, tc[wpc[1]]); } else if (phrCmp( 7, "time;", pc)) { putIc(OpTime, 0, 0, 0, 0); + } else if (phrCmp(11, "if ( !!**0 ) {", pc)) { // ブロックif. + bd += BInfSiz; + binf[bd] = BlkIf; + binf[bd + IfLabel0] = tmpLabelAlloc(); // 条件不成立のときの飛び先. + binf[bd + IfLabel1] = 0; + ifgoto(0, 1, binf[bd + IfLabel0]); // 条件を満たさなければ、binf[bd + IfLabel0]へgotoする. + } else if (phrCmp(12, "} else {", pc) && binf[bd] == BlkIf) { + binf[bd + IfLabel1] = tmpLabelAlloc(); // else節の終端. + putIc(OpGoto, &var[binf[bd + IfLabel1]], &var[binf[bd + IfLabel1]], 0, 0); + var[binf[bd + IfLabel0]] = icq - ic; // ラベルに対応するicqを記録しておく. + } else if (phrCmp( 13, "}", pc) && binf[bd] == BlkIf) { + if (binf[bd + IfLabel1] == 0) { + var[binf[bd + IfLabel0]] = icq - ic; // ラベルに対応するicqを記録しておく. + } else { + var[binf[bd + IfLabel1]] = icq - ic; // ラベルに対応するicqを記録しておく. + } + bd -= BInfSiz; + } else if (phrCmp(14, "for (!!***0; !!***1; !!***2) {", pc)) { // for文 + bd += BInfSiz; + binf[bd] = BlkFor; // ブロックのタイプ. + binf[bd + ForLopBgn] = tmpLabelAlloc(); // ループの頭に戻る用. + binf[bd + ForCont ] = tmpLabelAlloc(); // continue用. + binf[bd + ForBrk ] = tmpLabelAlloc(); // break用. + binf[bd + ForLbd0 ] = lbd; // 古い値を保存. + binf[bd + ForWpc01 ] = wpc [1]; + binf[bd + ForWpc11 ] = wpc1[1]; + binf[bd + ForWpc02 ] = wpc [2]; + binf[bd + ForWpc12 ] = wpc1[2]; + lbd = bd; + e0 = expr(0); + if (wpc[1] < wpc1[1]) { // !!***1に何らかの式が書いてあった. + ifgoto(1, IfFalse, binf[bd + ForBrk]); // 最初から条件不成立ならbreakへ. + } + var[binf[bd + ForLopBgn]] = icq - ic; // ラベルに対応するicqを記録しておく. + } else if (phrCmp(15, "}", pc) && binf[bd] == BlkFor) { + var[binf[bd + ForCont]] = icq - ic; // ラベルに対応するicqを記録しておく. + i = binf[bd + ForWpc01]; + j = binf[bd + ForWpc02]; + if (i + 3 == binf[bd + ForWpc11] && j + 2 == binf[bd + ForWpc12] && tc[i] == tc[j] && tc[i + 1] == TcLt && tc[j + 1] == TcPlPlus) { + // !!***1が「i < ?」かつ、!!***2が「i++」だったら(変数名はiじゃなくてもいいけど、共通である必要がある). + putIc(OpLop, &var[binf[bd + ForLopBgn]], &var[tc[i]], &var[tc[i + 2]], 0); + } else { + wpc [1] = binf[bd + ForWpc01]; + wpc1[1] = binf[bd + ForWpc11]; + wpc [2] = binf[bd + ForWpc02]; + wpc1[2] = binf[bd + ForWpc12]; + e2 = expr(2); + if (wpc[1] < wpc1[1]) { // !!***1に何らかの式が書いてあった. + ifgoto(1, IfTure, binf[bd + ForLopBgn]); + } else { + putIc(OpGoto, &var[binf[bd + ForLopBgn]], &var[binf[bd + ForLopBgn]], 0, 0); + } + } + var[binf[bd + ForBrk]] = icq - ic; // ラベルに対応するicqを記録しておく. + lbd = binf[bd + ForLbd0]; // 以前の値を復元. + bd -= BInfSiz; + } else if (phrCmp(16, "continue;", pc) && lbd > 0) { + putIc(OpGoto, &var[binf[lbd + ForCont]], &var[binf[lbd + ForCont]], 0, 0); + } else if (phrCmp(17, "break;", pc) && lbd > 0) { + putIc(OpGoto, &var[binf[lbd + ForBrk ]], &var[binf[lbd + ForBrk ]], 0, 0); + } else if (phrCmp(18, "if ( !!**0 ) continue;", pc) && lbd > 0) { + ifgoto(0, IfTrue, binf[lbd + ForCont]); + } else if (phrCmp(19, "if ( !!**0 ) break;", pc) && lbd > 0) { + ifgoto(0, IfTrue, binf[lbd + ForBrk ]); } else if (phrCmp( 8, "!!***0;", pc)) { // これはかなりマッチしやすいので最後にする. e0 = expr(0); } else goto err; tmpFree(e0); + tmpFree(e2); ! if (e0 < 0 || e2 < 0) goto err; pc = ppc1; } + if (bd > 0) { + printf("block nesting error (bd=%d, lbd=%d, pc=%d, pc1=%d\n", bd, lbd, pc, pc1); + return -1; + } putIc(OpEnd, 0, 0, 0, 0); icq1 = icq; for (icq = ic; icq < icq1; icq += 5) { // goto先の設定. i = (int) icq[0]; if (OpGoto <= i && i <= OpLop) { + icp = *icq[1] + ic; + while ((int) icp[0] == OpGoto) { // 飛び先がOpGotoだったら、さらにその先を読む(最適化). + icp = *icp[2] + ic; + } ! icq[1] = (IntP) icp; } } return icq1 - ic; err: printf("syntax error : %s %s %s %s\n", ts[tc[pc]], ts[tc[pc + 1]], ts[tc[pc + 2]], ts[tc[pc + 3]]); return -1; } void exec() { (中略) + case OpJge: if (*icp[2] >= *icp[3]) { icp = (IntP *) icp[1]; continue; } icp += 5; continue; + case OpJle: if (*icp[2] <= *icp[3]) { icp = (IntP *) icp[1]; continue; } icp += 5; continue; + case OpJgt: if (*icp[2] > *icp[3]) { icp = (IntP *) icp[1]; continue; } icp += 5; continue; (中略) } int run(String s) → HL-6と同じなので省略 /////////////////////////////////////////////////////////////////////////////// int main(int argc, const char **argv) → HL-5と同じなので省略 -トータルの行数は557行になっています。 -後で説明しますが、ブロックifとfor文を入れただけではなく、OpGotoの最適化の追加や、今までサボっていたOpJge, OpJle, OpJgtの追加もしました。 ---- -HL-8では普通にブロックifが使えます。なお、中の文が1文だけでも { } は省略できません。 if (a < 10) { a = 10; } -elseも使えます。でもやっぱり { } は省略できません。 if (a < 20) { c = c + 1; } else { d = d + 1; } -面倒になってきたので例は出しませんが、if文の中にif文を入れることもできます。 -今まで if ~ goto しかなかったので、ラベルを連発しなければいけませんでした。でももうそういうことがありません。 -for文も使えます。しかしこれも { } は省略できません。 for (i = 0; i < 10; i++) { print i; } ** (2) HL-8の簡単な説明 -今回からは、HL-8で新規に追加されたもの、変更を加えた部分のみ説明します(長くなってきたので)。 -関数: --void ifgoto(int i, int not, int label) ---条件式wpc[i]を評価して、その結果に応じてlabel(トークンコード)に分岐するコードを内部コードに出力します。 ---notはフラグで、IfTrueの場合は、条件が成立した場合に分岐させます。IfFalseの場合は、条件が不成立の場合に分岐させます。 --int tmpLabelAlloc() ---一時ラベル(一時変数のラベル版)を発行してトークンコードで返します。 ---一時ラベルは使い終わった後に再利用するということはないので、Freeはありません。 -変数: --int tmpLabelNo ---一時ラベルのラベル名を重複なく生成するための通し番号です。 --int binf[], bd, lbd; ---binf[]はblock-info.で、つまりコードブロックの情報です。bdはblock-depthで、ブロックの深さ、lbdはループ命令(今はforしかないですが)のbdです。 ---bdやlbdは1ずつ増減するのではなく、BInfSizずつ増減します。 ---binf[bd]は今のコードブロックが何のコードブロックなのかを表します。現状では、BlkIfかBlkForしかありません。 ---binf[bd - BInfSiz]は今のコードブロックの1つ外側、binf[bd - BInfSiz * 2]は今のコードブロックの2つ外側の情報になります。 ---より詳しい情報は、binf[bd + 1~]に入っています。 ---こういう変数がないと、ソースコード中に「 } 」があっても、ifの終わりなのか、forの終わりなのか、すぐには判断できなくなってしまいます。 ** (3) ブロックif文について -ブロックif文のためにcompile()に追加された部分を中心に説明します。 -まず HL-8 では、ブロックif文を次のように変換することで、実現しています。 -[1] if (条件式) { コードブロック#1 } の場合: if (!条件式) goto _tmpLabel0; コードブロック#1 _tmpLabel0: -[2] if (条件式) { コードブロック#1 } else { コードブロック#2 } の場合: if (!条件式) goto _tmpLabel0; コードブロック#1 goto _tmpLabel1; _tmpLabel0: コードブロック#2; _tmpLabel1: -この基本方針がわかれば、あとはそれほど難しくはありません。 -compile()の中を見ていきます。 } else if (phrCmp(11, "if ( !!**0 ) {", pc)) { // ブロックif. bd += BInfSiz; binf[bd] = BlkIf; binf[bd + IfLabel0] = tmpLabelAlloc(); // 条件不成立のときの飛び先. binf[bd + IfLabel1] = 0; ifgoto(0, 1, binf[bd + IfLabel0]); // 条件を満たさなければ、binf[bd + IfLabel0]へgotoする. -ブロックif文が現れたら、新しいコードブロックが始まるので、binf[]を準備します。 -そして_tmpLabel0を準備します。 -最後に「if (!条件式) goto _tmpLabel0;」に相当する内部コードをifgoto()で生成します。 } else if (phrCmp(12, "} else {", pc) && binf[bd] == BlkIf) { binf[bd + IfLabel1] = tmpLabelAlloc(); // else節の終端. putIc(OpGoto, &var[binf[bd + IfLabel1]], &var[binf[bd + IfLabel1]], 0, 0); var[binf[bd + IfLabel0]] = icq - ic; // ラベルに対応するicqを記録しておく. -「 } else { 」が来たら、これは上記の[2]の場合に相当します。 -_tmpLabel1も必要になるのでそれを準備したのち、goto _tmpLabel1;を出力します。 --ここで、OpGotoの仕様が変わって、飛び先を二度指定するようになっています。なぜそうしなければいけないかは後で説明します。 -そして、_tmpLabel0のラベルはここだよと宣言します。 -これで「 } else { 」の処理はおしまいです。 } else if (phrCmp( 13, "}", pc) && binf[bd] == BlkIf) { if (binf[bd + IfLabel1] == 0) { var[binf[bd + IfLabel0]] = icq - ic; // ラベルに対応するicqを記録しておく. } else { var[binf[bd + IfLabel1]] = icq - ic; // ラベルに対応するicqを記録しておく. } bd -= BInfSiz; -ブロックif文のコードブロックを閉じたときの処理です。 -これは[1]の場合と[2]の場合とで異なります。 -[1]の場合は、「_tmpLabel0:」の処理をやります。 -[2]の場合は、「_tmpLabel1:」の処理をやります。 -最後にbdをBInfSizだけ減じて、コードブロックを終了します。 ** (4) for文について -上記のブロックif文と似たような方法で、for文も実現しています。 -for文の変換は次のようにしています。 -for(式0; 条件式; 式2) { コードブロック } 式0; if (!条件式) goto _tmpLabel2; // 最初から条件が成立していなければ、ループに入らない. _tmpLabel0: コードブロック; _tmpLabel1: // continue命令が来たらここに行かせる. 式2; if (条件式) goto _tmpLabel0; _tmpLabel2: -この基本方針がわかれば、あとはそれほど難しくはありません。 -compile()の中を見ていきます。 } else if (phrCmp(14, "for (!!***0; !!***1; !!***2) {", pc)) { // for文 bd += BInfSiz; binf[bd] = BlkFor; // ブロックのタイプ. binf[bd + ForLopBgn] = tmpLabelAlloc(); // ループの頭に戻る用. binf[bd + ForCont ] = tmpLabelAlloc(); // continue用. binf[bd + ForBrk ] = tmpLabelAlloc(); // break用. binf[bd + ForLbd0 ] = lbd; // 古い値を保存. binf[bd + ForWpc01 ] = wpc [1]; binf[bd + ForWpc11 ] = wpc1[1]; binf[bd + ForWpc02 ] = wpc [2]; binf[bd + ForWpc12 ] = wpc1[2]; lbd = bd; e0 = expr(0); if (wpc[1] < wpc1[1]) { // !!***1に何らかの式が書いてあった. ifgoto(1, IfFalse, binf[bd + ForBrk]); // 最初から条件不成立ならbreakへ. } var[binf[bd + ForLopBgn]] = icq - ic; // ラベルに対応するicqを記録しておく. -for文では、あとで(=コードブロックを閉じるときに)条件式や式2の部分を利用するので、それらも全部binf[]にしまっておきます。 -「e0 = expr(0);」で 式0 の部分を内部コードとして出力させます。 -そして条件式に何か書いてあれば、条件不成立時にはループに侵入しないようにします。 -最後に _tmpLabel0: に相当する処理をしています。 } else if (phrCmp(15, "}", pc) && binf[bd] == BlkFor) { var[binf[bd + ForCont]] = icq - ic; // ラベルに対応するicqを記録しておく. i = binf[bd + ForWpc01]; j = binf[bd + ForWpc02]; if (i + 3 == binf[bd + ForWpc11] && j + 2 == binf[bd + ForWpc12] && tc[i] == tc[j] && tc[i + 1] == TcLt && tc[j + 1] == TcPlPlus) { // !!***1が「i < ?」かつ、!!***2が「i++」だったら(変数名はiじゃなくてもいいけど、共通である必要がある). putIc(OpLop, &var[binf[bd + ForLopBgn]], &var[tc[i]], &var[tc[i + 2]], 0); } else { wpc [1] = binf[bd + ForWpc01]; wpc1[1] = binf[bd + ForWpc11]; wpc [2] = binf[bd + ForWpc02]; wpc1[2] = binf[bd + ForWpc12]; e2 = expr(2); if (wpc[1] < wpc1[1]) { // !!***1に何らかの式が書いてあった. ifgoto(1, IfTrue, binf[bd + ForLopBgn]); } else { putIc(OpGoto, &var[binf[bd + ForLopBgn]], &var[binf[bd + ForLopBgn]], 0, 0); } } var[binf[bd + ForBrk]] = icq - ic; // ラベルに対応するicqを記録しておく. lbd = binf[bd + ForLbd0]; // 以前の値を復元. bd -= BInfSiz; -これはfor文のコードブロックを閉じるときの処理です。 -ちょっと長くなっていますが、これはOpLopが使える場合には使ってやろうとして、そのせいでややこしくなっています。 -OpLopを使わない、一般の場合の処理を見れば、「 _tmpLabel1: 」したあとで、「e2 = expr(2);」で 式2 を内部コードに変換し、さらに条件式を評価させて _tmpLabel0 に条件分岐させています。 -そして最後に「 _tmpLabel2: 」しています。 } else if (phrCmp(16, "continue;", pc) && lbd > 0) { putIc(OpGoto, &var[binf[lbd + ForCont]], &var[binf[lbd + ForCont]], 0, 0); } else if (phrCmp(17, "break;", pc) && lbd > 0) { putIc(OpGoto, &var[binf[lbd + ForBrk ]], &var[binf[lbd + ForBrk ]], 0, 0); -これはcontinue文とbreak分です。どちらもOpGotoで無条件分岐しています。 } else if (phrCmp(18, "if ( !!**0 ) continue;", pc) && lbd > 0) { ifgoto(0, IfTrue, binf[lbd + ForCont]); } else if (phrCmp(19, "if ( !!**0 ) break;", pc) && lbd > 0) { ifgoto(0, IfTrue, binf[lbd + ForBrk ]); -これは条件付きのcontinueとbreak;です。ifgotoで処理しています。 ** (5) OpGoto最適化について -無条件分岐、もしくは条件分岐で、飛び先がいきなり無条件分岐になっている場合があります。 -たとえばこれです。 i = 0; for (;;) { i = i + 1; if (i > 100) break; if (i % 7 == 0) { print i; } } -これはそのままでは以下のような感じに読み替えられて内部コードに変換されます。 i = 0; _t0: i = i + 1; if (i > 100) goto _t2; if (i % 7 == 0) goto _t1; print i; _t1: goto _t0; _t2: -ここで、goto _t1;の部分が気になります。なぜなら、goto _t1;すると直ちにgoto _t0;するからです。それならgoto _t1;の部分をgoto _t0;に読み替えてしまったほうが動作は高速になります。 -そういう最適化をやろうというのが、ここでの目標です。 -[1] putIc(OpGoto, A, 0, 0, 0); を putIc(OpGoto, A, A, 0, 0); に変更しました。 -[2] compile()の最後の「goto先の設定」を以下のように改造しました。 for (icq = ic; icq < icq1; icq += 5) { // goto先の設定. i = (int) icq[0]; if (OpGoto <= i && i <= OpLop) { + icp = *icq[1] + ic; + while ((int) icp[0] == OpGoto) { // 飛び先がOpGotoだったら、さらにその先を読む(最適化). + icp = *icp[2] + ic; + } ! icq[1] = (IntP) icp; } } -これはつまり、goto先がOpGotoだったら、その飛び先を取得するようにしているだけです。 -その先がOpGotoならさらにそれも取得しますし、さらに先も見ます。OpGotoの連鎖が終わるまで全部たどります。 -OpGotoのicp[2]は本来は不要なのですが、icp[1]の部分は途中で書き換えてしまって、追跡に使えなくなってしまうので、icp[2]のほうにある壊されることのないポインタを使ってたどるようにしています。 ** (6) ifgoto()の仕組みについて -これは短くて簡単な関数ではありますが、説明があったほうがいいかもしれないと思ったので書きます。 void ifgoto(int i, int not, int label) { int j = wpc[i]; if (j + 3 == wpc1[i] && TcEEq <= tc[j + 1] && tc[j + 1] <= TcGt) { // 条件式の長さが3トークンで、真ん中が比較演算子だったら. putIc(((tc[j + 1] - TcEEq) ^ not) + OpJeq, &var[label], &var[tc[j]], &var[tc[j + 2]], 0); } else { i = expr(i); putIc(OpJne - not, &var[label], &var[i], &var[Tc0], 0); tmpFree(i); } } -まずnot=0、つまりIfTrueを指定した場合だけを考えます。 -すると、条件式の長さが3で、かつ真ん中が比較演算子の場合は、TcEEq~TcGtがそのままOpJeq~OpJgtになります(^0という演算は何もしないのと同じなので)。 -そしてそれ以外の場合は、式をexpr(i);で評価した後で、その結果がTc0と比較されて、OpJneで条件分岐することになります。 -「式の値がゼロでなければ分岐せよ」なので、これでいいわけです。 -では今度はnot=1、つまりIfFalseを指定した場合だけを考えます。 -条件式の長さが3で、かつ真ん中が比較演算子の場合、 |真ん中の比較演算子(=tc[j+1])|tc[j+1]-TcEEq(→A値)|A値^1(→B値)|B値+OpJeq| |TcEEq(==)|0|1|OpJne(!=)| |TcNEq(!=)|1|0|OpJeq(==)| |TcLt (< )|2|3|OpJge(>=)| |TcGe (>=)|3|2|OpJlt(< )| |TcLe (<=)|4|5|OpJgt(> )| |TcGt (> )|5|4|OpJle(<=)| -とまあこんな風に計算されるおかげで、ちゃんと期待通り条件が不成立の時に分岐するようになります。 -それ以外の条件式の時は、OpJne-notがOpJeqになるので、式の値が0のときだけ分岐するようになり、これも期待通りになります。 ** 次回に続く -次回: [[a21_txt01_8a]] --次回は配列のサポートがメインです。 *こめんと欄 #comment
タイムスタンプを変更しない
* 川合のプログラミング言語自作のためのテキスト第三版#8 -(by [[K]], 2021.03.13) ** (1) HL-8 -今回は、ブロックifとfor文を追加します。 #include <stdio.h> #include <stdlib.h> #include <string.h> #include <time.h> typedef unsigned char *String; // こう書くと String は unsigned char * の代用になる. int loadText(String path, String t, int siz) → HL-4と同じなので省略 /////////////////////////////////////////////////////////////////////////////// #define MAX_TC 1000 // トークンコードの最大値. String ts[MAX_TC + 1]; // トークンの内容(文字列)を記憶. int tl[MAX_TC + 1]; // トークンの長さ. unsigned char tcBuf[(MAX_TC + 1) * 10]; // トークン1つ当たり平均10バイトを想定. int tcs = 0, tcb = 0; int var[MAX_TC + 1]; // 変数. int getTc(String s, int len) → HL-4と同じなので省略 /////////////////////////////////////////////////////////////////////////////// int isAlphabetOrNumber(unsigned char c) → HL-2と同じなので省略 int lexer(String s, int tc[]) → HL-2と同じなので省略 int tc[10000]; // トークンコード. enum { TcSemi = 0, TcDot, TcWiCard, Tc0, Tc1, Tc2, Tc3, Tc4, Tc5, Tc6, Tc7, Tc8, TcBrOpn, TcBrCls, TcSqBrOpn, TcSqBrCls, TcCrBrOpn, TcCrBrCls, TcEEq, TcNEq, TcLt, TcGe, TcLe, TcGt, TcPlus, TcMinus, TcAster, TcSlash, TcPerce, TcAnd, TcShr, TcPlPlus, TcEqu, TcComma, TcExpr, TcExpr0, TcTmp0, TcTmp1, TcTmp2, TcTmp3, TcTmp4, TcTmp5, TcTmp6, TcTmp7, TcTmp8, TcTmp9 }; char tcInit[] = "; . !!* 0 1 2 3 4 5 6 7 8 ( ) [ ] { } == != < >= <= > + - * / % & >> ++ = , !!** !!*** _t0 _t1 _t2 _t3 _t4 _t5 _t6 _t7 _t8 _t9"; /////////////////////////////////////////////////////////////////////////////// int phrCmp_tc[32 * 100], ppc1, wpc[9], wpc1[9]; // ppc1:一致したフレーズの次のトークンをさす, wpc[]:ワイルドカードのトークンの場所をさす. int phrCmp(int pid, String phr, int pc) → HL-7と同じなので省略 /////////////////////////////////////////////////////////////////////////////// typedef int *IntP; // こう書くと IntP は int * の代わりに使えるようになる. enum { OpCpy = 0, OpCeq, OpCne, OpClt, OpCge, OpCle, OpCgt, OpAdd, OpSub, OpMul, OpDiv, OpMod, OpAnd, OpShr, OpAdd1, OpNeg, OpGoto, OpJeq, OpJne, OpJlt, OpJge, OpJle, OpJgt, OpLop, OpPrint, OpTime, OpEnd }; IntP ic[10000], *icq; // ic[]:内部コード、icq:ic[]への書き込み用ポインタ. void putIc(int op, IntP p0, IntP p1, IntP p2, IntP p3) → HL-6と同じなので省略 /////////////////////////////////////////////////////////////////////////////// char tmp_flag[10]; // 一時変数の利用状況を管理. int tmpAlloc() → HL-7と同じなので省略 void tmpFree(int i) → HL-7と同じなので省略 /////////////////////////////////////////////////////////////////////////////// int epc, epc1; // exprのためのpcとpc1. int exprSub(int priority); // exprSub1()が参照するので、プロトタイプ宣言. int expr(int j); int exprSub1(int i, int priority, int op) → HL-7と同じなので省略 int exprSub(int priority) → HL-7と同じなので省略 int expr(int j) → HL-7と同じなので省略 /////////////////////////////////////////////////////////////////////////////// → ここから下は全部HL-8で新規追加(ここより上は一切変化なし) enum { IfTrue = 0, IfFalse = 1 }; void ifgoto(int i, int not, int label) { int j = wpc[i]; if (j + 3 == wpc1[i] && TcEEq <= tc[j + 1] && tc[j + 1] <= TcGt) { // 条件式の長さが3トークンで、真ん中が比較演算子だったら. putIc(((tc[j + 1] - TcEEq) ^ not) + OpJeq, &var[label], &var[tc[j]], &var[tc[j + 2]], 0); } else { i = expr(i); putIc(OpJne - not, &var[label], &var[i], &var[Tc0], 0); tmpFree(i); } } int tmpLabelNo; int tmpLabelAlloc() { char s[10]; sprintf(s, "_l%d", tmpLabelNo); tmpLabelNo++; return getTc(s, strlen(s)); } #define BInfSiz 10 int binf[BInfSiz * 100], bd, lbd; // binf:block-info, bd:block-depth, lbd:loop-block-depth enum { BlkIf = 1, BlkFor }; enum { IfLabel0 = 1, IfLabel1 }; enum { ForLopBgn = 1, ForCont, ForBrk, ForLbd0, ForWpc01, ForWpc11, ForWpc02, ForWpc12 }; /////////////////////////////////////////////////////////////////////////////// → HL-8での新規追加の範囲終了 int compile(String s) { ! int pc, pc1, i, j; ! IntP *icq1, *icp; pc1 = lexer(s, tc); tc[pc1++] = TcSemi; // 末尾に「;」を付け忘れることが多いので、付けてあげる. tc[pc1] = tc[pc1 + 1] = tc[pc1 + 2] = tc[pc1 + 3] = TcDot; // エラー表示用のために末尾にピリオドを登録しておく. icq = ic; for (i = 0; i < 10; i++) { ・// 一時変数をすべて未使用にする. tmp_flag[i] = 0; } + tmpLabelNo = 0; + bd = lbd = 0; for (pc = 0; pc < pc1; ) { // コンパイル開始. ! int e0 = 0, e2 = 0; if (phrCmp( 1, "!!*0 = !!*1;", pc)) { // 単純代入. putIc(OpCpy, &var[tc[wpc[0]]], &var[tc[wpc[1]]], 0, 0); } else if (phrCmp(10, "!!*0 = !!*1 + 1; if (!!*2 < !!*3) goto !!*4;", pc) && tc[wpc[0]] == tc[wpc[1]] && tc[wpc[0]] == tc[wpc[2]]) { putIc(OpLop, &var[tc[wpc[4]]], &var[tc[wpc[0]]], &var[tc[wpc[3]]], 0); } else if (phrCmp( 9, "!!*0 = !!*1 + 1;", pc) && tc[wpc[0]] == tc[wpc[1]]) { // 高速化のために+1専用の命令を用意(せこくてすみません). putIc(OpAdd1, &var[tc[wpc[0]]], 0, 0, 0); } else if (phrCmp( 2, "!!*0 = !!*1 + !!*2;", pc)) { // 加算. putIc(OpAdd, &var[tc[wpc[0]]], &var[tc[wpc[1]]], &var[tc[wpc[2]]], 0); } else if (phrCmp( 3, "!!*0 = !!*1 - !!*2;", pc)) { // 減算. putIc(OpSub, &var[tc[wpc[0]]], &var[tc[wpc[1]]], &var[tc[wpc[2]]], 0); } else if (phrCmp( 4, "print !!**0;", pc)) { // print. e0 = expr(0); putIc(OpPrint, &var[e0], 0, 0, 0); } else if (phrCmp( 0, "!!*0:", pc)) { // ラベル定義命令. var[tc[wpc[0]]] = icq - ic; // ラベルに対応するicqを記録しておく. } else if (phrCmp( 5, "goto !!*0;", pc)) { // goto. ! putIc(OpGoto, &var[tc[wpc[0]]], &var[tc[wpc[0]]], 0, 0); // OpGotoの仕様変更. ! } else if (phrCmp( 6, "if (!!**0) goto !!*1;", pc)) { ! ifgoto(0, IfTrue, tc[wpc[1]]); } else if (phrCmp( 7, "time;", pc)) { putIc(OpTime, 0, 0, 0, 0); + } else if (phrCmp(11, "if ( !!**0 ) {", pc)) { // ブロックif. + bd += BInfSiz; + binf[bd] = BlkIf; + binf[bd + IfLabel0] = tmpLabelAlloc(); // 条件不成立のときの飛び先. + binf[bd + IfLabel1] = 0; + ifgoto(0, 1, binf[bd + IfLabel0]); // 条件を満たさなければ、binf[bd + IfLabel0]へgotoする. + } else if (phrCmp(12, "} else {", pc) && binf[bd] == BlkIf) { + binf[bd + IfLabel1] = tmpLabelAlloc(); // else節の終端. + putIc(OpGoto, &var[binf[bd + IfLabel1]], &var[binf[bd + IfLabel1]], 0, 0); + var[binf[bd + IfLabel0]] = icq - ic; // ラベルに対応するicqを記録しておく. + } else if (phrCmp( 13, "}", pc) && binf[bd] == BlkIf) { + if (binf[bd + IfLabel1] == 0) { + var[binf[bd + IfLabel0]] = icq - ic; // ラベルに対応するicqを記録しておく. + } else { + var[binf[bd + IfLabel1]] = icq - ic; // ラベルに対応するicqを記録しておく. + } + bd -= BInfSiz; + } else if (phrCmp(14, "for (!!***0; !!***1; !!***2) {", pc)) { // for文 + bd += BInfSiz; + binf[bd] = BlkFor; // ブロックのタイプ. + binf[bd + ForLopBgn] = tmpLabelAlloc(); // ループの頭に戻る用. + binf[bd + ForCont ] = tmpLabelAlloc(); // continue用. + binf[bd + ForBrk ] = tmpLabelAlloc(); // break用. + binf[bd + ForLbd0 ] = lbd; // 古い値を保存. + binf[bd + ForWpc01 ] = wpc [1]; + binf[bd + ForWpc11 ] = wpc1[1]; + binf[bd + ForWpc02 ] = wpc [2]; + binf[bd + ForWpc12 ] = wpc1[2]; + lbd = bd; + e0 = expr(0); + if (wpc[1] < wpc1[1]) { // !!***1に何らかの式が書いてあった. + ifgoto(1, IfFalse, binf[bd + ForBrk]); // 最初から条件不成立ならbreakへ. + } + var[binf[bd + ForLopBgn]] = icq - ic; // ラベルに対応するicqを記録しておく. + } else if (phrCmp(15, "}", pc) && binf[bd] == BlkFor) { + var[binf[bd + ForCont]] = icq - ic; // ラベルに対応するicqを記録しておく. + i = binf[bd + ForWpc01]; + j = binf[bd + ForWpc02]; + if (i + 3 == binf[bd + ForWpc11] && j + 2 == binf[bd + ForWpc12] && tc[i] == tc[j] && tc[i + 1] == TcLt && tc[j + 1] == TcPlPlus) { + // !!***1が「i < ?」かつ、!!***2が「i++」だったら(変数名はiじゃなくてもいいけど、共通である必要がある). + putIc(OpLop, &var[binf[bd + ForLopBgn]], &var[tc[i]], &var[tc[i + 2]], 0); + } else { + wpc [1] = binf[bd + ForWpc01]; + wpc1[1] = binf[bd + ForWpc11]; + wpc [2] = binf[bd + ForWpc02]; + wpc1[2] = binf[bd + ForWpc12]; + e2 = expr(2); + if (wpc[1] < wpc1[1]) { // !!***1に何らかの式が書いてあった. + ifgoto(1, IfTure, binf[bd + ForLopBgn]); + } else { + putIc(OpGoto, &var[binf[bd + ForLopBgn]], &var[binf[bd + ForLopBgn]], 0, 0); + } + } + var[binf[bd + ForBrk]] = icq - ic; // ラベルに対応するicqを記録しておく. + lbd = binf[bd + ForLbd0]; // 以前の値を復元. + bd -= BInfSiz; + } else if (phrCmp(16, "continue;", pc) && lbd > 0) { + putIc(OpGoto, &var[binf[lbd + ForCont]], &var[binf[lbd + ForCont]], 0, 0); + } else if (phrCmp(17, "break;", pc) && lbd > 0) { + putIc(OpGoto, &var[binf[lbd + ForBrk ]], &var[binf[lbd + ForBrk ]], 0, 0); + } else if (phrCmp(18, "if ( !!**0 ) continue;", pc) && lbd > 0) { + ifgoto(0, IfTrue, binf[lbd + ForCont]); + } else if (phrCmp(19, "if ( !!**0 ) break;", pc) && lbd > 0) { + ifgoto(0, IfTrue, binf[lbd + ForBrk ]); } else if (phrCmp( 8, "!!***0;", pc)) { // これはかなりマッチしやすいので最後にする. e0 = expr(0); } else goto err; tmpFree(e0); + tmpFree(e2); ! if (e0 < 0 || e2 < 0) goto err; pc = ppc1; } + if (bd > 0) { + printf("block nesting error (bd=%d, lbd=%d, pc=%d, pc1=%d\n", bd, lbd, pc, pc1); + return -1; + } putIc(OpEnd, 0, 0, 0, 0); icq1 = icq; for (icq = ic; icq < icq1; icq += 5) { // goto先の設定. i = (int) icq[0]; if (OpGoto <= i && i <= OpLop) { + icp = *icq[1] + ic; + while ((int) icp[0] == OpGoto) { // 飛び先がOpGotoだったら、さらにその先を読む(最適化). + icp = *icp[2] + ic; + } ! icq[1] = (IntP) icp; } } return icq1 - ic; err: printf("syntax error : %s %s %s %s\n", ts[tc[pc]], ts[tc[pc + 1]], ts[tc[pc + 2]], ts[tc[pc + 3]]); return -1; } void exec() { (中略) + case OpJge: if (*icp[2] >= *icp[3]) { icp = (IntP *) icp[1]; continue; } icp += 5; continue; + case OpJle: if (*icp[2] <= *icp[3]) { icp = (IntP *) icp[1]; continue; } icp += 5; continue; + case OpJgt: if (*icp[2] > *icp[3]) { icp = (IntP *) icp[1]; continue; } icp += 5; continue; (中略) } int run(String s) → HL-6と同じなので省略 /////////////////////////////////////////////////////////////////////////////// int main(int argc, const char **argv) → HL-5と同じなので省略 -トータルの行数は557行になっています。 -後で説明しますが、ブロックifとfor文を入れただけではなく、OpGotoの最適化の追加や、今までサボっていたOpJge, OpJle, OpJgtの追加もしました。 ---- -HL-8では普通にブロックifが使えます。なお、中の文が1文だけでも { } は省略できません。 if (a < 10) { a = 10; } -elseも使えます。でもやっぱり { } は省略できません。 if (a < 20) { c = c + 1; } else { d = d + 1; } -面倒になってきたので例は出しませんが、if文の中にif文を入れることもできます。 -今まで if ~ goto しかなかったので、ラベルを連発しなければいけませんでした。でももうそういうことがありません。 -for文も使えます。しかしこれも { } は省略できません。 for (i = 0; i < 10; i++) { print i; } ** (2) HL-8の簡単な説明 -今回からは、HL-8で新規に追加されたもの、変更を加えた部分のみ説明します(長くなってきたので)。 -関数: --void ifgoto(int i, int not, int label) ---条件式wpc[i]を評価して、その結果に応じてlabel(トークンコード)に分岐するコードを内部コードに出力します。 ---notはフラグで、IfTrueの場合は、条件が成立した場合に分岐させます。IfFalseの場合は、条件が不成立の場合に分岐させます。 --int tmpLabelAlloc() ---一時ラベル(一時変数のラベル版)を発行してトークンコードで返します。 ---一時ラベルは使い終わった後に再利用するということはないので、Freeはありません。 -変数: --int tmpLabelNo ---一時ラベルのラベル名を重複なく生成するための通し番号です。 --int binf[], bd, lbd; ---binf[]はblock-info.で、つまりコードブロックの情報です。bdはblock-depthで、ブロックの深さ、lbdはループ命令(今はforしかないですが)のbdです。 ---bdやlbdは1ずつ増減するのではなく、BInfSizずつ増減します。 ---binf[bd]は今のコードブロックが何のコードブロックなのかを表します。現状では、BlkIfかBlkForしかありません。 ---binf[bd - BInfSiz]は今のコードブロックの1つ外側、binf[bd - BInfSiz * 2]は今のコードブロックの2つ外側の情報になります。 ---より詳しい情報は、binf[bd + 1~]に入っています。 ---こういう変数がないと、ソースコード中に「 } 」があっても、ifの終わりなのか、forの終わりなのか、すぐには判断できなくなってしまいます。 ** (3) ブロックif文について -ブロックif文のためにcompile()に追加された部分を中心に説明します。 -まず HL-8 では、ブロックif文を次のように変換することで、実現しています。 -[1] if (条件式) { コードブロック#1 } の場合: if (!条件式) goto _tmpLabel0; コードブロック#1 _tmpLabel0: -[2] if (条件式) { コードブロック#1 } else { コードブロック#2 } の場合: if (!条件式) goto _tmpLabel0; コードブロック#1 goto _tmpLabel1; _tmpLabel0: コードブロック#2; _tmpLabel1: -この基本方針がわかれば、あとはそれほど難しくはありません。 -compile()の中を見ていきます。 } else if (phrCmp(11, "if ( !!**0 ) {", pc)) { // ブロックif. bd += BInfSiz; binf[bd] = BlkIf; binf[bd + IfLabel0] = tmpLabelAlloc(); // 条件不成立のときの飛び先. binf[bd + IfLabel1] = 0; ifgoto(0, 1, binf[bd + IfLabel0]); // 条件を満たさなければ、binf[bd + IfLabel0]へgotoする. -ブロックif文が現れたら、新しいコードブロックが始まるので、binf[]を準備します。 -そして_tmpLabel0を準備します。 -最後に「if (!条件式) goto _tmpLabel0;」に相当する内部コードをifgoto()で生成します。 } else if (phrCmp(12, "} else {", pc) && binf[bd] == BlkIf) { binf[bd + IfLabel1] = tmpLabelAlloc(); // else節の終端. putIc(OpGoto, &var[binf[bd + IfLabel1]], &var[binf[bd + IfLabel1]], 0, 0); var[binf[bd + IfLabel0]] = icq - ic; // ラベルに対応するicqを記録しておく. -「 } else { 」が来たら、これは上記の[2]の場合に相当します。 -_tmpLabel1も必要になるのでそれを準備したのち、goto _tmpLabel1;を出力します。 --ここで、OpGotoの仕様が変わって、飛び先を二度指定するようになっています。なぜそうしなければいけないかは後で説明します。 -そして、_tmpLabel0のラベルはここだよと宣言します。 -これで「 } else { 」の処理はおしまいです。 } else if (phrCmp( 13, "}", pc) && binf[bd] == BlkIf) { if (binf[bd + IfLabel1] == 0) { var[binf[bd + IfLabel0]] = icq - ic; // ラベルに対応するicqを記録しておく. } else { var[binf[bd + IfLabel1]] = icq - ic; // ラベルに対応するicqを記録しておく. } bd -= BInfSiz; -ブロックif文のコードブロックを閉じたときの処理です。 -これは[1]の場合と[2]の場合とで異なります。 -[1]の場合は、「_tmpLabel0:」の処理をやります。 -[2]の場合は、「_tmpLabel1:」の処理をやります。 -最後にbdをBInfSizだけ減じて、コードブロックを終了します。 ** (4) for文について -上記のブロックif文と似たような方法で、for文も実現しています。 -for文の変換は次のようにしています。 -for(式0; 条件式; 式2) { コードブロック } 式0; if (!条件式) goto _tmpLabel2; // 最初から条件が成立していなければ、ループに入らない. _tmpLabel0: コードブロック; _tmpLabel1: // continue命令が来たらここに行かせる. 式2; if (条件式) goto _tmpLabel0; _tmpLabel2: -この基本方針がわかれば、あとはそれほど難しくはありません。 -compile()の中を見ていきます。 } else if (phrCmp(14, "for (!!***0; !!***1; !!***2) {", pc)) { // for文 bd += BInfSiz; binf[bd] = BlkFor; // ブロックのタイプ. binf[bd + ForLopBgn] = tmpLabelAlloc(); // ループの頭に戻る用. binf[bd + ForCont ] = tmpLabelAlloc(); // continue用. binf[bd + ForBrk ] = tmpLabelAlloc(); // break用. binf[bd + ForLbd0 ] = lbd; // 古い値を保存. binf[bd + ForWpc01 ] = wpc [1]; binf[bd + ForWpc11 ] = wpc1[1]; binf[bd + ForWpc02 ] = wpc [2]; binf[bd + ForWpc12 ] = wpc1[2]; lbd = bd; e0 = expr(0); if (wpc[1] < wpc1[1]) { // !!***1に何らかの式が書いてあった. ifgoto(1, IfFalse, binf[bd + ForBrk]); // 最初から条件不成立ならbreakへ. } var[binf[bd + ForLopBgn]] = icq - ic; // ラベルに対応するicqを記録しておく. -for文では、あとで(=コードブロックを閉じるときに)条件式や式2の部分を利用するので、それらも全部binf[]にしまっておきます。 -「e0 = expr(0);」で 式0 の部分を内部コードとして出力させます。 -そして条件式に何か書いてあれば、条件不成立時にはループに侵入しないようにします。 -最後に _tmpLabel0: に相当する処理をしています。 } else if (phrCmp(15, "}", pc) && binf[bd] == BlkFor) { var[binf[bd + ForCont]] = icq - ic; // ラベルに対応するicqを記録しておく. i = binf[bd + ForWpc01]; j = binf[bd + ForWpc02]; if (i + 3 == binf[bd + ForWpc11] && j + 2 == binf[bd + ForWpc12] && tc[i] == tc[j] && tc[i + 1] == TcLt && tc[j + 1] == TcPlPlus) { // !!***1が「i < ?」かつ、!!***2が「i++」だったら(変数名はiじゃなくてもいいけど、共通である必要がある). putIc(OpLop, &var[binf[bd + ForLopBgn]], &var[tc[i]], &var[tc[i + 2]], 0); } else { wpc [1] = binf[bd + ForWpc01]; wpc1[1] = binf[bd + ForWpc11]; wpc [2] = binf[bd + ForWpc02]; wpc1[2] = binf[bd + ForWpc12]; e2 = expr(2); if (wpc[1] < wpc1[1]) { // !!***1に何らかの式が書いてあった. ifgoto(1, IfTrue, binf[bd + ForLopBgn]); } else { putIc(OpGoto, &var[binf[bd + ForLopBgn]], &var[binf[bd + ForLopBgn]], 0, 0); } } var[binf[bd + ForBrk]] = icq - ic; // ラベルに対応するicqを記録しておく. lbd = binf[bd + ForLbd0]; // 以前の値を復元. bd -= BInfSiz; -これはfor文のコードブロックを閉じるときの処理です。 -ちょっと長くなっていますが、これはOpLopが使える場合には使ってやろうとして、そのせいでややこしくなっています。 -OpLopを使わない、一般の場合の処理を見れば、「 _tmpLabel1: 」したあとで、「e2 = expr(2);」で 式2 を内部コードに変換し、さらに条件式を評価させて _tmpLabel0 に条件分岐させています。 -そして最後に「 _tmpLabel2: 」しています。 } else if (phrCmp(16, "continue;", pc) && lbd > 0) { putIc(OpGoto, &var[binf[lbd + ForCont]], &var[binf[lbd + ForCont]], 0, 0); } else if (phrCmp(17, "break;", pc) && lbd > 0) { putIc(OpGoto, &var[binf[lbd + ForBrk ]], &var[binf[lbd + ForBrk ]], 0, 0); -これはcontinue文とbreak分です。どちらもOpGotoで無条件分岐しています。 } else if (phrCmp(18, "if ( !!**0 ) continue;", pc) && lbd > 0) { ifgoto(0, IfTrue, binf[lbd + ForCont]); } else if (phrCmp(19, "if ( !!**0 ) break;", pc) && lbd > 0) { ifgoto(0, IfTrue, binf[lbd + ForBrk ]); -これは条件付きのcontinueとbreak;です。ifgotoで処理しています。 ** (5) OpGoto最適化について -無条件分岐、もしくは条件分岐で、飛び先がいきなり無条件分岐になっている場合があります。 -たとえばこれです。 i = 0; for (;;) { i = i + 1; if (i > 100) break; if (i % 7 == 0) { print i; } } -これはそのままでは以下のような感じに読み替えられて内部コードに変換されます。 i = 0; _t0: i = i + 1; if (i > 100) goto _t2; if (i % 7 == 0) goto _t1; print i; _t1: goto _t0; _t2: -ここで、goto _t1;の部分が気になります。なぜなら、goto _t1;すると直ちにgoto _t0;するからです。それならgoto _t1;の部分をgoto _t0;に読み替えてしまったほうが動作は高速になります。 -そういう最適化をやろうというのが、ここでの目標です。 -[1] putIc(OpGoto, A, 0, 0, 0); を putIc(OpGoto, A, A, 0, 0); に変更しました。 -[2] compile()の最後の「goto先の設定」を以下のように改造しました。 for (icq = ic; icq < icq1; icq += 5) { // goto先の設定. i = (int) icq[0]; if (OpGoto <= i && i <= OpLop) { + icp = *icq[1] + ic; + while ((int) icp[0] == OpGoto) { // 飛び先がOpGotoだったら、さらにその先を読む(最適化). + icp = *icp[2] + ic; + } ! icq[1] = (IntP) icp; } } -これはつまり、goto先がOpGotoだったら、その飛び先を取得するようにしているだけです。 -その先がOpGotoならさらにそれも取得しますし、さらに先も見ます。OpGotoの連鎖が終わるまで全部たどります。 -OpGotoのicp[2]は本来は不要なのですが、icp[1]の部分は途中で書き換えてしまって、追跡に使えなくなってしまうので、icp[2]のほうにある壊されることのないポインタを使ってたどるようにしています。 ** (6) ifgoto()の仕組みについて -これは短くて簡単な関数ではありますが、説明があったほうがいいかもしれないと思ったので書きます。 void ifgoto(int i, int not, int label) { int j = wpc[i]; if (j + 3 == wpc1[i] && TcEEq <= tc[j + 1] && tc[j + 1] <= TcGt) { // 条件式の長さが3トークンで、真ん中が比較演算子だったら. putIc(((tc[j + 1] - TcEEq) ^ not) + OpJeq, &var[label], &var[tc[j]], &var[tc[j + 2]], 0); } else { i = expr(i); putIc(OpJne - not, &var[label], &var[i], &var[Tc0], 0); tmpFree(i); } } -まずnot=0、つまりIfTrueを指定した場合だけを考えます。 -すると、条件式の長さが3で、かつ真ん中が比較演算子の場合は、TcEEq~TcGtがそのままOpJeq~OpJgtになります(^0という演算は何もしないのと同じなので)。 -そしてそれ以外の場合は、式をexpr(i);で評価した後で、その結果がTc0と比較されて、OpJneで条件分岐することになります。 -「式の値がゼロでなければ分岐せよ」なので、これでいいわけです。 -では今度はnot=1、つまりIfFalseを指定した場合だけを考えます。 -条件式の長さが3で、かつ真ん中が比較演算子の場合、 |真ん中の比較演算子(=tc[j+1])|tc[j+1]-TcEEq(→A値)|A値^1(→B値)|B値+OpJeq| |TcEEq(==)|0|1|OpJne(!=)| |TcNEq(!=)|1|0|OpJeq(==)| |TcLt (< )|2|3|OpJge(>=)| |TcGe (>=)|3|2|OpJlt(< )| |TcLe (<=)|4|5|OpJgt(> )| |TcGt (> )|5|4|OpJle(<=)| -とまあこんな風に計算されるおかげで、ちゃんと期待通り条件が不成立の時に分岐するようになります。 -それ以外の条件式の時は、OpJne-notがOpJeqになるので、式の値が0のときだけ分岐するようになり、これも期待通りになります。 ** 次回に続く -次回: [[a21_txt01_8a]] --次回は配列のサポートがメインです。 *こめんと欄 #comment
テキスト整形のルールを表示する