第17章動的評価

評価器の仕組みそれ自体については前章までで既に完結している。本章ではその全てにパーサまでを加えた﹁広義の評価器﹂としての全体像を検証しよう。対象となるのはeval・Module#module_eval・Object#instance_evalの三つである。

`eval`

evalについては既に話したが、ここではより細かい話をしようと思う。 evalを使うと実行時にその場で文字列をコンパイルし、評価することができる。返り値はそのプログラムの最後の式の値だ。

p eval("1 + 1")   # 2

evalする文字列の中からはそのスコープの変数も参照できる。

lvar = 5
@ivar = 6
p eval("lvar + @ivar")   # 11

ここまで読んできた読者なら﹁そのスコープ﹂という言葉を安直に読み飛ばせなくなっているだろう。例えば定数の﹁スコープ﹂はどうなっているんだ、なんてことが気にならないだろうか。筆者は気になる。結論から言うと、基本的にevalの外の環境をそのまま引き継ぐと思っていい。またメソッド定義もクラス定義もできる。

def a
  eval('class C;  def test() puts("ok") end   end')
end

a()          # クラスCとC#testを定義する
C.new.test   # okと表示される

さらに、前章で少し言及したが、第二引数にProcを渡すとその環境で評価できる、

def new_env
  n = 5
  Proc.new { nil }   # このメソッドの環境をオブジェクトにして返す
end

p eval('n * 3', new_env())   # 15

`module_eval`と`instance_eval`

Procをevalの第二引数に渡すとその環境で評価できた。module_evalと instance_evalはその限定版︵あるいはショートカット︶である。 module_evalではモジュール文やクラス文の内部にいるかのような環境で評価できる。

lvar = "toplevel lvar"   # スコープ確認用のローカル変数

module M
end
M.module_eval(<<'EOS')   # こういうときこそヒアドキュメント
    p lvar   # 参照できる
    p self   # Mと表示される
    def ok   # M#okを定義する
      puts 'ok'
    end
EOS

instance_evalは特異クラス文でselfがそのオブジェクトになった環境で評価できる。

lvar = "toplevel lvar"   # スコープ確認用のローカル変数

obj = Object.new
obj.instance_eval(<<'EOS')
    p lvar   # 参照できる
    p self   # #<Object:0x40274f5c>と表示される
    def ok   # obj.okを定義する
      puts 'ok'
    end
EOS

またこのmodule_evalとinstance_evalはイテレータとして使うこともできて、その場合はブロックがそれぞれの環境で評価される。例えば

obj = Object.new
p obj                 # #<Object:0x40274fac>
obj.instance_eval {
    p self            # #<Object:0x40274fac>
}

というように。ただ文字列を使う場合とブロックを使う場合とではローカル変数まわりの挙動が違う。例えばメソッドaでブロックを作りメソッドbでinstance_evalしたら、ブロックはaのローカル変数を参照する。メソッドaで文字列を作りメソッドbでinstance_evalしたら、その文字列の中からはbのローカル変数を参照する。ローカル変数のスコープはあくまで﹁コンパイル時に﹂決まるので、毎回コンパイルする文字列と、ファイルロード時にコンパイルされてしまうブロックでは結果が違うわけだ。

`eval`

`eval()`

Rubyのevalは引数のあるなしで場合分けが多いので、呼び出し形式は

eval(prog_string, some_block)

と限定しよう。すると実際のインターフェイス関数rb_f_eval()はほとんど意味がなくなるので、もう一つ下の関数のeval()から見ていくことにする。 eval()の関数プロトタイプは

static VALUE
eval(VALUE self, VALUE src, VALUE scope, char *file, int line);

で、scopeが第二引数のProc。fileとlineはevalする文字列が置いてあると仮定するファイル名・行番号である。では中身を見てみよう。 ▼eval()︵簡約版︶

4984  static VALUE
4985  eval(self, src, scope, file, line)
4986      VALUE self, src, scope;
4987      char *file;
4988      int line;
4989  {
4990      struct BLOCK *data = NULL;
4991      volatile VALUE result = Qnil;
4992      struct SCOPE * volatile old_scope;
4993      struct BLOCK * volatile old_block;
4994      struct RVarmap * volatile old_dyna_vars;
4995      VALUE volatile old_cref;
4996      int volatile old_vmode;
4997      volatile VALUE old_wrapper;
4998      struct FRAME frame;
4999      NODE *nodesave = ruby_current_node;
5000      volatile int iter = ruby_frame->iter;
5001      int state;
5002
5003      if (!NIL_P(scope)) {  /* 今は常に真 */
5009          Data_Get_Struct(scope, struct BLOCK, data);
5010          /* dataからBLOCKを積む */
5011          frame = data->frame;
5012          frame.tmp = ruby_frame; /* GCよけ */
5013          ruby_frame = &(frame);
5014          old_scope = ruby_scope;
5015          ruby_scope = data->scope;
5016          old_block = ruby_block;
5017          ruby_block = data->prev;
5018          old_dyna_vars = ruby_dyna_vars;
5019          ruby_dyna_vars = data->dyna_vars;
5020          old_vmode = scope_vmode;
5021          scope_vmode = data->vmode;
5022          old_cref = (VALUE)ruby_cref;
5023          ruby_cref = (NODE*)ruby_frame->cbase;
5024          old_wrapper = ruby_wrapper;
5025          ruby_wrapper = data->wrapper;
5032          self = data->self;
5033          ruby_frame->iter = data->iter;
5034      }
5045      PUSH_CLASS();
5046      ruby_class = ruby_cbase;  /* == ruby_frame->cbase */
5047
5048      ruby_in_eval++;
5049      if (TYPE(ruby_class) == T_ICLASS) {
5050          ruby_class = RBASIC(ruby_class)->klass;
5051      }
5052      PUSH_TAG(PROT_NONE);
5053      if ((state = EXEC_TAG()) == 0) {
5054          NODE *node;
5055
5056          result = ruby_errinfo;
5057          ruby_errinfo = Qnil;
5058          node = compile(src, file, line);
5059          if (ruby_nerrs > 0) {
5060              compile_error(0);
5061          }
5062          if (!NIL_P(result)) ruby_errinfo = result;
5063          result = eval_node(self, node);
5064      }
5065      POP_TAG();
5066      POP_CLASS();
5067      ruby_in_eval--;
5068      if (!NIL_P(scope)) {  /* 今は常に真 */
5069          int dont_recycle = ruby_scope->flags & SCOPE_DONT_RECYCLE;
5070
5071          ruby_wrapper = old_wrapper;
5072          ruby_cref  = (NODE*)old_cref;
5073          ruby_frame = frame.tmp;
5074          ruby_scope = old_scope;
5075          ruby_block = old_block;
5076          ruby_dyna_vars = old_dyna_vars;
5077          data->vmode = scope_vmode; /* 可視性スコープの変更を保存 */
5078          scope_vmode = old_vmode;
5079          if (dont_recycle) {
                  /* ……SCOPE・BLOCK・VARSをコピーする…… */
5097          }
5098      }
5104      if (state) {
5105          if (state == TAG_RAISE) {
                  /* ……例外オブジェクトを準備…… */
5121              rb_exc_raise(ruby_errinfo);
5122          }
5123          JUMP_TAG(state);
5124      }
5125
5126      return result;
5127  }

(eval.c)

前置きもなしにこの関数をいきなり見せられたら﹁ぐぁっ﹂となるだろうが、ここまでeval.cの関数を撃破してきた我々にとってはもはや敵ではない。この関数はひたすらスタックを退避・復帰しているだけだ。注意すべきところは以下の三点だけである。 ●珍しくFRAMEも︵コピー・プッシュではなく︶置き換えている ●ruby_crefはruby_frame->cbaseで代用︵？︶している ●scope_vmodeだけは単純な復帰ではなくdataに影響を与えるそしてメイン部分は真ん中あたりにあるcompile()とeval_node()だ。 eval_node()なんてもう忘れられていそうだが、引数nodeの評価を開始する関数である。ruby_run()でも使われていた。 compile()はこうだ。 ▼compile()

4968  static NODE*
4969  compile(src, file, line)
4970      VALUE src;
4971      char *file;
4972      int line;
4973  {
4974      NODE *node;
4975
4976      ruby_nerrs = 0;
4977      Check_Type(src, T_STRING);
4978      node = rb_compile_string(file, src, line);
4979
4980      if (ruby_nerrs == 0) return node;
4981      return 0;
4982  }

(eval.c)

ruby_nerrsはyyerror()の中でインクリメントされる変数である。つまりこの変数が非ゼロならパースエラーが起こったことを示す。また rb_compile_string()は既に第二部で扱っている。Rubyの文字列を構文木にコンパイルする関数だった。ここで一つ問題になってくるのがローカル変数である。第12章﹃構文木の構築﹄で見た通り、ローカル変数はlvtblを使って管理されているのだった。しかしいまは既にSCOPE︵と、もしかしたらVARSも︶が存在しているのだから、それに上書き追加する形でパースしなければならない。これが実はeval()の核心であり、最悪に難しいところなのだ。再びparse.yに戻ってこの探索を完結させることにしよう。

`top_local`

ローカル変数の管理テーブルstruct local_varsを積むときに使うのは local_push() local_pop()という関数だったが、実はparse.yには管理用テーブルを積む関数がもう一組ある。 top_local_init()とtop_local_setup()だ。それはこんな感じで呼ばれている。 ▼top_local_init()の呼ばれかた

program :   { top_local_init(); }
          compstmt
            { top_local_setup(); }

もちろん実際には他にもいろいろやっているのだが、今はどうでもいいので全部カットした。そしてその内容はこうだ。 ▼top_local_init()

5273  static void
5274  top_local_init()
5275  {
5276      local_push(1);
5277      lvtbl->cnt = ruby_scope->local_tbl?ruby_scope->local_tbl[0]:0;
5278      if (lvtbl->cnt > 0) {
5279          lvtbl->tbl = ALLOC_N(ID, lvtbl->cnt+3);
5280          MEMCPY(lvtbl->tbl, ruby_scope->local_tbl, ID, lvtbl->cnt+1);
5281      }
5282      else {
5283          lvtbl->tbl = 0;
5284      }
5285      if (ruby_dyna_vars)
5286          lvtbl->dlev = 1;
5287      else
5288          lvtbl->dlev = 0;
5289  }

(parse.y)

つまりruby_scopeからlvtblにlocal_tblをコピーしておく。ブロックローカル変数についてはあとでまとめて見たほうがいいので、とりあえず普通のローカル変数に集中しよう。続いてtop_local_setup()だ。 ▼top_local_setup()

5291  static void
5292  top_local_setup()
5293  {
5294      int len = lvtbl->cnt;  /* パース後のローカル変数の数 */
5295      int i;                 /* パース前のローカル変数の数 */
5296
5297      if (len > 0) {
5298          i = ruby_scope->local_tbl ? ruby_scope->local_tbl[0] : 0;
5299
5300          if (i < len) {
5301              if (i == 0 || (ruby_scope->flags & SCOPE_MALLOC) == 0) {
5302                  VALUE *vars = ALLOC_N(VALUE, len+1);
5303                  if (ruby_scope->local_vars) {
5304                      *vars++ = ruby_scope->local_vars[-1];
5305                      MEMCPY(vars, ruby_scope->local_vars, VALUE, i);
5306                      rb_mem_clear(vars+i, len-i);
5307                  }
5308                  else {
5309                      *vars++ = 0;
5310                      rb_mem_clear(vars, len);
5311                  }
5312                  ruby_scope->local_vars = vars;
5313                  ruby_scope->flags |= SCOPE_MALLOC;
5314              }
5315              else {
5316                  VALUE *vars = ruby_scope->local_vars-1;
5317                  REALLOC_N(vars, VALUE, len+1);
5318                  ruby_scope->local_vars = vars+1;
5319                  rb_mem_clear(ruby_scope->local_vars+i, len-i);
5320              }
5321              if (ruby_scope->local_tbl &&
                      ruby_scope->local_vars[-1] == 0) {
5322                  free(ruby_scope->local_tbl);
5323              }
5324              ruby_scope->local_vars[-1] = 0;  /* NODEはもういらない */
5325              ruby_scope->local_tbl = local_tbl();
5326          }
5327      }
5328      local_pop();
5329  }

(parse.y)

local_varsはスタックにあったりヒープにあったりするので多少ややこしくなってはいるが、ruby_scopeのlocal_tblとlocal_varsをアップデートしているだけである︵SCOPE_MALLOCが立っているとlocal_varsはmalloc()割り当て︶。またここでalloca()を使っても意味がないので強制的にmalloc()割り当てに変更するしかない。

ブロックローカル変数

ところでブロックローカル変数はどうなっているのだろうか。それを考えるにはまずパーサのエントリポイントyycompile()に戻らなければならない。 ▼ruby_dyna_varsの退避

static NODE*
yycompile(f, line)
{
    struct RVarmap *vars = ruby_dyna_vars;
         :
    n = yyparse();
         :
    ruby_dyna_vars = vars;
}

単なる退避・復帰のようにも見えるのだが、ruby_dyna_varsをクリアしてはいないところがポイントだ。つまり評価器で作ったRVarmapのリンクにパーサでも直接要素を追加していくことになる。しかしruby_dyna_varsはパーサと評価器で構造が違ったはずだ。リンクが常に単線なのは問題なさそうだが、ヘッダ︵id=0のRVarmap︶の付きかたの違いはどうするのだろう。そこで役に立つのがtop_local_init()にあったlocal_push(1)の﹁1﹂である。local_push()の引数が真になるとruby_dyna_varsの最初のヘッダを付けなくなる。つまり、図1のようになる。これでeval文字列の中から外のスコープのブロックローカル変数を参照できることが確認できた。 (dynavars)

図1: eval中のruby_dyna_vars いや、確かに参照はできるけどもruby_dyna_varsはパーサでは全部解放していたはずじゃあないのか、評価器で作ったリンクを解放されたらどうする……ということに気付いてしまった人は次のところを読んで安心してもらいたい。 ▼yycompile()−ruby_dyna_varsの解放

2386      vp = ruby_dyna_vars;
2387      ruby_dyna_vars = vars;
2388      lex_strterm = 0;
2389      while (vp && vp != vars) {
2390          struct RVarmap *tmp = vp;
2391          vp = vp->next;
2392          rb_gc_force_recycle((VALUE)tmp);
2393      }

(parse.y)

評価器で作ったリンク︵vars︶まで来たらちゃんとループが止まるようになっているのだ。

`instance_eval`

全体像

Module#module_evalの実体はrb_mod_module_eval()、 Object#instance_evalの実体はrb_obj_instance_eval()である。 ▼rb_mod_module_eval() rb_obj_instance_eval()

5316  VALUE
5317  rb_mod_module_eval(argc, argv, mod)
5318      int argc;
5319      VALUE *argv;
5320      VALUE mod;
5321  {
5322      return specific_eval(argc, argv, mod, mod);
5323  }

5298  VALUE
5299  rb_obj_instance_eval(argc, argv, self)
5300      int argc;
5301      VALUE *argv;
5302      VALUE self;
5303  {
5304      VALUE klass;
5305
5306      if (rb_special_const_p(self)) {
5307          klass = Qnil;
5308      }
5309      else {
5310          klass = rb_singleton_class(self);
5311      }
5312
5313      return specific_eval(argc, argv, klass, self);
5314  }

(eval.c)

この二つのメソッドは﹁selfとclassを置き換えるメソッド﹂として共通化できるのでその部分がspecific_eval()でまとめられている。この先のことも含めて図示してみよう︵図2︶。括弧付きは関数ポインタでの呼び出しだ。 (speceval)

図2: コールグラフ instance_evalにしてもmodule_evalにしてもブロックと文字列の両方を受けられるので、それぞれ固有の処理をするようevalとyieldに別れる。ただしそのほとんどの部分はまた共通なので、その部分がexec_under()としてくくり出してあるわけだ。しかし読む側からすると 2\times 2=4 通りを同時に相手にすることになってしまうわけで、それは得策ではない。だからここでは (一)instance_evalで、 (二)文字列を引数に取るときだけを考えてrb_obj_instance_eval()以下の関数を全てインライン展開、定数畳み込みをかけたものを読むことにする。

併合後

全部まとめたらこうなった。併合前と比べると随分わかりやすくなっている。 ▼specific_eval()−instance_eval、eval、文字列

static VALUE
instance_eval_string(self, src, file, line)
    VALUE self, src;
    const char *file;
    int line;
{
    VALUE sclass;
    VALUE result;
    int state;
    int mode;

    sclass = rb_singleton_class(self);

    PUSH_CLASS();
    ruby_class = sclass;
    PUSH_FRAME();
    ruby_frame->self       = ruby_frame->prev->self;
    ruby_frame->last_func  = ruby_frame->prev->last_func;
    ruby_frame->last_class = ruby_frame->prev->last_class;
    ruby_frame->argc       = ruby_frame->prev->argc;
    ruby_frame->argv       = ruby_frame->prev->argv;
    if (ruby_frame->cbase != sclass) {
        ruby_frame->cbase = rb_node_newnode(NODE_CREF, sclass, 0,
                                            ruby_frame->cbase);
    }
    PUSH_CREF(sclass);

    mode = scope_vmode;
    SCOPE_SET(SCOPE_PUBLIC);
    PUSH_TAG(PROT_NONE);
    if ((state = EXEC_TAG()) == 0) {
        result = eval(self, src, Qnil, file, line);
    }
    POP_TAG();
    SCOPE_SET(mode);

    POP_CREF();
    POP_FRAME();
    POP_CLASS();
    if (state) JUMP_TAG(state);

    return result;
}

オブジェクトの特異クラスをCLASSとCREFとruby_frame->cbaseにプッシュする。ということらしい。主処理はeval()一発である。いつもと違ってFRAMEを構造体コピーで初期化したりしていないのが珍しいが、それもたいした違いではない。

併合前

読みやすくなったと筆者は言ってはいるが、もしかしたら併合前から簡単だったのかもしれない。併合前のものと比べてどのあたりが簡単にされているのか検証してみよう。まずspecific_eval()だ。この関数はRubyとのインターフェイス部分のコードを共通化するためのものなので、ほとんどが引数のパースである。それを全部削るとこうなる。 ▼specific_eval()︵簡約版︶

5258  static VALUE
5259  specific_eval(argc, argv, klass, self)
5260      int argc;
5261      VALUE *argv;
5262      VALUE klass, self;
5263  {
5264      if (rb_block_given_p()) {

5268          return yield_under(klass, self);
5269      }
5270      else {

5294          return eval_under(klass, self, argv[0], file, line);
5295      }
5296  }

(eval.c)

この通りブロックがあるかどうかで完璧に二通りに分かれており、それぞれのルートのコードが影響を与えあったりすることはない。だから読むときは片方ずつ読むべきだ。併合版ではまずこの点が改善されている。またyield_under()を読むときはfileとlineが関係ないので、 yieldルートを主体に併合した場合はこの引数のパースについては全く考えなくていいことが明確になるだろう。次にeval_under()とeval_under_i()を見てみよう。 ▼eval_under()

5222  static VALUE
5223  eval_under(under, self, src, file, line)
5224      VALUE under, self, src;
5225      const char *file;
5226      int line;
5227  {
5228      VALUE args[4];
5229
5230      if (ruby_safe_level >= 4) {
5231          StringValue(src);
5232      }
5233      else {
5234          SafeStringValue(src);
5235      }
5236      args[0] = self;
5237      args[1] = src;
5238      args[2] = (VALUE)file;
5239      args[3] = (VALUE)line;
5240      return exec_under(eval_under_i, under, under, args);
5241  }

5214  static VALUE
5215  eval_under_i(args)
5216      VALUE *args;
5217  {
5218      return eval(args[0], args[1], Qnil, (char*)args[2], (int)args[3]);
5219  }

(eval.c)

この関数では引数を一つにするために配列argsを経由して渡している。このargsはeval_under()からeval_under_i()に渡すための一時的なコンテナなんだろうな、と予想はできるが、本当にそうなのかはわからない。もしかしたら exec_under()の中でargsを加工したりしているのかもしれない。コードの共通化の方法としてはこれは非常に正しいやりかただが、読む側からするとこういう間接的な渡しが入ると理解しづらいものだ。特にfileとlineにはコンパイラを胡麻化すために無駄なキャストが入っているので本当の型がなんなのか想像しにくい。このあたりは併合版では全て消滅しているので迷わずに済む。ただ併合したり展開したりするほうが常にわかりやすいかというとそうでもない。例えばexec_under()を呼ぶときは第二引数も第三引数もunderを渡しているが、exec_under()の側ではパラメータ変数を両方ともunderに展開してしまっていいのだろうか。と言うのは、 exec_under()の第二・第三引数とは実はプッシュすべきCLASSとCREFを示しているのである。CLASSとCREFは﹁別のもの﹂なので、別の変数を使うほうがいいかもしれない。先の併合版でもここだけは

VALUE sclass = .....;
VALUE cbase = sclass;

としようかと思ったのだが、いきなりこれだけ変数を残しても違和感があるかと思い、sclassで展開しておいた。つまり文章の流れ上の都合でしかない。これまで何回も引数を展開したり関数を展開したりしてきたが、そのたびに展開する理由をしつこく説明してきた。即ち ●とりうるパターンが数パターンに限られているとき ●動作が微妙に変わるときである。﹁とにかく手でいろいろなものを展開すれば簡単になるんだ﹂なんてことを言っているわけでは、決してない。どんなときでも優先するのは自分にとっての理解しやすさであって、手順を守ることではない。展開してしまったほうがわかりやすいなら、展開する。展開しない、あるいは逆に手続きにまとめたほうがわかりやすいと感じるならそうしよう。rubyの場合は元がちゃんと書けているので展開するばかりだったが、下手な人の書いたソースなら関数にくくりまくるほうがわかりやすくなることも多いはずだ。

第17章 動的評価

概略

eval

module_evalとinstance_eval

eval

eval()

top_local

ブロックローカル変数

instance_eval

全体像

併合後

併合前

第17章動的評価

`eval`

`module_eval`と`instance_eval`

`eval`

`eval()`

`top_local`

`instance_eval`