* [[a21_txt01_6]]の補足説明#1 -(by [[K]], 2021.02.04) ** (0) -これは[[「川合のプログラミング言語自作のためのテキスト第三版#6」>a21_txt01_6]]に対する補足説明のページです。 ** (1) ループ命令の追加でどこまで速くなるか? -TL-6は結構高速で、10億回ループの速度ではgcc比で''11.3倍''まで来ましたが、もっと速くできないでしょうか?そのためにはどうしたらいいでしょうか? -x86にはLOOP命令というのがあります。LOOP命令は、ECXレジスタの値を1減じて、もし0でなければ指定したアドレスに分岐することができます。別にこのことそのものはすごくないのですが、それが1命令できるというのがポイントです。 -では、TL-6に似たような命令を追加したとしたらどうでしょうか。しかし完全には真似せずに、1加算して、所定の値と比較して、もし等しくなかったら分岐するということにします。これは私の観察では、ほとんどのループではループカウンタを減少ではなく増加させているからです。 -変更箇所を中心に書きます。 enum { OpCpy = 0, OpAdd, OpSub, OpPrint, OpGoto, OpJeq, OpJne, OpTime, OpEnd, OpAdd1, OpLop }; // OpLopを追加. int compile(String s) { (中略) for (pc = 0; pc < pc1; pc++) { // コンパイル開始. + if (phrCmp( 13, "!!* = !!* + 1 ; if ( !!* != !!* ) goto !!* ;", tc, pc) && tc[pc] == tc[pc + 2] && tc[pc] == tc[pc + 8]) { + icp[0] = (PtrTyp) OpLop; + icp[1] = &var[tc[pc + 13]]; + icp[2] = &var[tc[pc]]; + icp[3] = &var[tc[pc + 10]]; + icp += 5; + pc += 13; + continue; + } if (phrCmp( 1, "=", tc, pc + 1)) { // 2単語目が"=". (中略) for (icp = ic; icp < icp1; icp += 5) { i = (int) icp[0]; if (i == OpGoto || i == OpJne || i == OpJeq || i == OpLop) { // OpLopを追加. icp[1] = &ic[*(IntP)icp[1]]; } } (中略) } void exec() { clock_t t0 = clock(); PtrTyp *icp = ic; + int i; for (;;) { switch ((int) icp[0]) { (中略) + case OpLop: + i = *(IntP)icp[2]; + i++; + *(IntP)icp[2] = i; + if (i != *(IntP)icp[3]) { + icp = icp[1]; + continue; + } + icp+=5; + continue; } } } -プログラムでは、LOOP命令を使うための新しい構文は用意しないで、単に「i=i+1; if (i != 〇〇) goto ××;」みたいなのが出現したら適用するようにしています。 -このため、TL-3用のサンプルプログラムは無修正でも適用されるようになります。 -さてその速さは・・・gcc比で''6.7倍''まで高速化できました! ** (2) なぜこんなに効果があったのか? -それはつまり、icpに加算してcontinueしてそしてswitchするというのが、結構なコストになっているからです。だから2つの命令をくっつけて1つにするだけで、それが1回減らせて、かなりの高速化になったわけです。 -このことから教訓を得るとするなら、使用頻度が高いものについては1命令で複数の機能を実行できるような、そんな命令を作ったほうが良いということになります。 * こめんと欄 #comment