コンテンツにスキップ

ナッシュ均衡

出典: フリー百科事典『ウィキペディア(Wikipedia)』

: Nash equilibrium




[]


 G= (N, S, u) N      




si i 

純粋戦略ゲームにおけるナッシュ均衡[編集]

支配戦略均衡[編集]

純粋戦略ゲーム (Pure strategy game) とは、参加者 (プレーヤー) が必ずどれかの戦略を選ぶゲームである。例えば、以下の表は、二人のプレーヤー Pa と Pb がそれぞれ戦略(A1 または A2)と(B1 または B2)を選べるときの、それぞれの利得を示す。並んだ数字の左側は Pa の利得、右側は Pb の利得である。

Pa/Pb B1 B2
A1 5, 2 2, 4
A2 4, 6 1, 6

Pa Pb Pa A1 A1 

Pb Pa B2 B1 Pa A2 B1 B2 B2 

Pa A1Pb B2  (A1, B2) 

PaPb  (A1, B2) PaA2 21Pb B1 42

PaPb  (A2, B1)  (4, 6) PaPb Pa 5A1 (A1, B2)  (A2, B1)  (A1, B2) 

[]



Pa/Pb B1 B2 B3
A1 5, 2 2, 4 4, 0
A2 4, 6 3, 6 2, 5
A3 3, 3 1, 2 7, 2

B3 は B2 に支配されているため、B3 を消去。

Pa/Pb B1 B2
A1 5, 2 2, 4
A2 4, 6 3, 6
A3 3, 3 1, 2

A3 は A2 に支配されているため A3 を消去。

Pa/Pb B1 B2
A1 5, 2 2, 4
A2 4, 6 3, 6

B1 は B2 に支配されているため B1 を消去。

Pa/Pb B2
A1 2, 4
A2 3, 6

支配戦略均衡は (A2, B2)。

純粋戦略ナッシュ均衡[編集]

他のプレイヤーの戦略によらず最大利得をもたらす戦略の組合せも被支配戦略の逐次消去によって求まる戦略の組合せも支配戦略均衡であるが、ゲームの設定によっては上述した2つの方法では均衡を求めることができない。ナッシュ均衡の定義によれば他のプレイヤーの戦略を最適反応であると仮定したうえで自身の最適反応を求めればよいので、支配戦略均衡が存在しない純粋戦略ゲームにおいてもナッシュ均衡を見つけることができる。

たとえば上の3×3の標準形ゲームの (A1, B3) の利得を (4, 0) から (4, 5) に変えればどの戦略も逐次消去されず、支配戦略均衡が求まらないが、

Pa/Pb B1 B2 B3
A1 5, 2 2, 4 4, 5
A2 4, 6 3, 6 2, 5
A3 3, 3 1, 2 7, 2

相手の戦略を所与としたときに最大利得をもたらす戦略(最適反応)を組み合わせていくと、唯一 (A2, B2) が最適反応の組合せになっていることがわかる。従ってこのゲームには純粋戦略ナッシュ均衡が一組存在する。

混合戦略ゲームにおけるナッシュ均衡[編集]

混合戦略ゲームとは、参加者が行動を確率的に選ぶような戦略をとることでナッシュ均衡に到達する非協力ゲームのことである。このようなゲームでは純粋戦略ナッシュ均衡が必ずしも存在せず、ナッシュ均衡は各参加者の行動確率の組として表される。有限の(=プレーヤーの数と各プレーヤーの戦略の数が有限の)混合戦略ゲームでは少なくとも1つのナッシュ均衡が存在することはナッシュの定理で証明されている(ナッシュは、この証明を角谷の不動点定理を応用することによって得た)。

以下では具体例を用いて混合戦略ナッシュ均衡を求めてみる。2人のプレイヤー Pa と Pb はそれぞれ2つの戦略から1つを選択するが、相手がどの戦略を選択するかはわからないため、各プレイヤーが確率的に相手の行動を予測する。すなわち Pa は相手 (Pb) が確率 q で B1 を選択し、Pb は相手 (Pa) が確率 p で A1 を選択すると予想しているとする。

Pa/Pb B1
確率 q
B2
確率 (1 − q)
A1
確率 p
1, 2 0, 0
A2
確率 (1 − p)
0, 0 2, 1

この表のゲームにおいて Pa の得る利得の期待値は:

  • A1を選択:1 × q + 0 × (1 − q)
  • A2を選択:0 × q + 2 × (1 − q)

一方、 Pb の得る利得の期待値は:

  • B1を選択:2 × p + 0 × (1 − p)
  • B2を選択:0 × p + 1 × (1 − p)

ここで最適反応をとるとは相手の行動確率に関して期待利得がより大きな戦略を選ぶことであるから、以下のように各プレイヤーの行動をまとめることができる。

Pa/Pb p > 1/3 p < 1/3
q > 2/3 p=1, q=1 p=1, q=0
q < 2/3 p=0, q=1 p=0, q=0

p=1/3, q=2/3 pqPa  (1/3, 2/3) Pb  (2/3, 1/3) 


[]

[]


Nash, J. (January 15, 1950). Equilibrium Points in n-Person Games. Proc. Natl. Acad. Sci. U.S.A. (NAS) 36 (1): 4849. Bibcode: 1950PNAS...36...48N. doi:10.1073/pnas.36.1.48. ISSN 0027-8424. JSTOR 88031. LCCN 16-10069. OCLC 43473694. PMC 1063129. PMID 16588946. http://www.sscnet.ucla.edu/polisci/faculty/chwe/austen/nash1950.pdf. 

Glicksberg, I. L. (February 1952). A Further Generalization of the Kakutani Fixed-Point Theorem, with Applications to Nash Equilibrium Points. Proc. Am. Math. Soc. (AMS) 3 (1): 170-174. doi:10.2307/2032478. ISSN 0002-9939. JSTOR 2032478. LCCN 51-3937. OCLC 1480367. http://www.ams.org/journals/proc/1952-003-01/S0002-9939-1952-0046638-5/S0002-9939-1952-0046638-5.pdf. 

[]


   19957ASIN 442385080XISBN 978-4423850800 NCID BN12843079OCLC 673606398:95072397 

 ︿2009511ASIN 4480092110ISBN 978-4-480-09211-3 NCID BA89979297OCLC 326519825:21624029 

Aviad Rubinstein: "Hardness of Approximation Between P and NP", ACM, ISBN 978-1-947487-23-9 (May 2019), doi:10.1145/3241304. 

[]







[]


() -