a21_txt01_6の補足説明#1

  • (by K, 2021.02.04)

(0)

(1) ループ命令の追加でどこまで速くなるか?

  • TL-6は結構高速で、10億回ループの速度ではgcc比で11.3倍まで来ましたが、もっと速くできないでしょうか?そのためにはどうしたらいいでしょうか?
  • x86にはLOOP命令というのがあります。LOOP命令は、ECXレジスタの値を1減じて、もし0でなければ指定したアドレスに分岐することができます。別にこのことそのものはすごくないのですが、それが1命令できるというのがポイントです。
  • では、TL-6に似たような命令を追加したとしたらどうでしょうか。しかし完全には真似せずに、1加算して、所定の値と比較して、もし等しくなかったら分岐するということにします。これは私の観察では、ほとんどのループではループカウンタを減少ではなく増加させているからです。
  • 変更箇所を中心に書きます。
enum { OpCpy = 0, OpAdd, OpSub, OpPrint, OpGoto, OpJeq, OpJne, OpTime, OpEnd, OpAdd1, OpLop }; // OpLopを追加.

int compile(String s)
{
    (中略)
    for (pc = 0; pc < pc1; pc++) { // コンパイル開始.
+       if (phrCmp( 13, "!!* = !!* + 1 ; if ( !!* != !!* ) goto !!* ;", tc, pc) && tc[pc] == tc[pc + 2] && tc[pc] == tc[pc + 8]) {
+           putIc3(OpLop, &var[tc[pc + 13]], &var[tc[pc]], &var[tc[pc + 10]]);
+           pc += 13;
+           continue;
+       }
        if (phrCmp(  1, "=", tc, pc + 1)) { // 2単語目が"=".
    (中略)
    for (icq = ic; icq < icq1; icq += 5) {  // goto先の設定.
        i = (int) icq[0];
        if (i == OpGoto || i == OpJne || i == OpJeq || i == OpLop) { // OpLopを追加.
            icp[1] = &ic[*(IntP)icq[1]];
        }
    }
    (中略)
}

void exec()
{
    clock_t t0 = clock();
    PtrTyp *icp = ic;
+   int i;
    for (;;) {
        switch ((int) icp[0]) {
        (中略)
+       case OpLop:
+           i = *(IntP)icp[2];
+           i++;
+           *(IntP)icp[2] = i;
+           if (i != *(IntP)icp[3]) {
+               icp = icp[1];
+               continue;
+           }
+           icp += 5;
+           continue;
        }
    }
}
  • プログラムでは、LOOP命令を使うための新しい構文は用意しないで、単に「i=i+1; if (i != 〇〇) goto ××;」みたいなのが出現したら適用するようにしています。
  • このため、TL-3用のサンプルプログラムは無修正でも適用されるようになります。
  • さてその速さは・・・gcc比で6.5倍まで高速化できました!

(2) なぜこんなに効果があったのか?

  • それはつまり、icpに加算してcontinueしてそしてswitchするというのが、結構なコストになっているからです。だから2つの命令をくっつけて1つにするだけで、それが1回減らせて、かなりの高速化になったわけです。
  • このことから教訓を得るとするなら、使用頻度が高いものについては1命令で複数の機能を実行できるような、そんな内部命令を作ったほうが良いということになります。

こめんと欄


コメントお名前NameLink

トップ   編集 凍結 差分 バックアップ 添付 複製 名前変更 リロード   新規 一覧 単語検索 最終更新   ヘルプ   最終更新のRSS
Last-modified: 2021-02-17 (水) 23:26:49 (17d)