Zofia Zieli ´nska-Kolasi ´nska Teoria gier – równowaga Nasha Instytut Matematyki
Wydział Nauk ´Scisłych i Przyrodniczych
Uniwersytet Przyrodniczo-Humanistyczny w Siedlcach
CWICZENIA ´
gry o sumie zerowej: równowaga Nasha i racjonalizowalno´s´c, strategie zdominowane, strategie optymalne i warto´s´c gry, twierdzenie o minimaksie
(wersja: 23 pa´zdziernika 2020)
Zakres materiału
1 . Poj ˛ecia:
(a) gra o sumie zerowej,
(b) strategie ´sci´sle/słabo dominuj ˛ ace i zdominowane, (c) równowaga w strategiach dominuj ˛ acych,
(d) najlepsza odpowied´z,
(e) iteracja i strategie racjonalizowane (f) równowaga Nasha
(g) strategie i zbiory kongruentne,
(h) równowaga Nasha w strategiach mieszanych.
Poj˛ecia wst˛epne
1 . Gra o sumie zerowej Z grami o sumie zerowej mamy do czynienia wsz ˛edzie tam, gdzie interesy graczy s ˛ a dokładnie przeciwstawne, czyli tam, gdzie zysk jednego gracza jest równy przegranej drugiego. Gry te słu ˙z ˛ a wi ˛ec do modelowania sytuacji czystego konfliktu, w których nie ma mowy o współpracy mi ˛edzy graczami, ze wzgl ˛edu na wyra´zn ˛ a sprzeczno´s´c ich interesów.
Dominacja i najlepsza odpowied´z
1 . Strategie ´sci´sle/słabo dominuj ˛ ace i zdominowane Strategia s
i0´sci´sle dominuje wszystkie inne strategie gracza i je ˙zeli wypłata ze strategii s
0ijest wi ˛eksza od wypłaty dla jakiejkolwiek innej strategii, niezale ˙znie od tego, jak ˛ a strategi ˛e wybior ˛ a pozostali gracze:
π ( s
0i,s
−i) > π ( s
i,s
−i) , dla wszystkich s
ii dla wszystkich s
−i,
gdzie s
−ioznacza wektor zło ˙zony ze strategii wybranych przez wszystkich graczy oprócz gracza i.
Strategia s
0isłabo dominuje strategi ˛e s
∗ije ˙zeli wypłata ze strategii s
0ijest przynajmniej tak samo wysoka jak dla s
∗idla wszystkich mo ˙zliwych strategii pozostałych graczy, przy czym dla przynaj- mniej jednej z nich jest wy ˙zsza:
π ( s
0i,s
−i) ≥ π ( s
∗i,s
−i) , dla wszystkich s
−i,
π ( s
0i,ˆs
−i) > π ( s
∗i,ˆs
−i) , dla pewnego ˆs
−i.
W tym przypadku s
∗ijest strategi ˛ a zdominowan ˛ a. Je ˙zeli s
0isłabo dominuje ka ˙zd ˛ a inn ˛ a strategi ˛e s
∗i, to s
0ijest strategi ˛ a słabo dominuj ˛ ac ˛ a.
Strategia jest niezdominowana je ˙zeli nie jest zdominowana przez ˙zadn ˛ a inn ˛ a strategi ˛e.
Strategie zdominowane s ˛ a złe, strategie niezdominowane s ˛ a dobre. Strategia dominuj ˛ aca jest szcze- góln ˛ a strategi ˛ a niezdominowan ˛ a, która dominuje wszystkie inne. Jest to najlepsza strategia.
(a) Zadanie
i. Dlaczego rozstrzygaj ˛ ac, czy strategia s
0idominuje nad strategi ˛ a s
∗i, bierze si ˛e pod uwag ˛e jedynie wypłaty gracza i?
ii. Wykaza´c, ˙ze gracz mo ˙ze mie´c tylko jedn ˛ a strategi ˛e ´sci´sle dominuj ˛ ac ˛ a.
iii. Czy gracz mo ˙ze mie´c wi ˛ecej ni ˙z jedn ˛ a strategi ˛e słabo dominuj ˛ ac ˛ a?
iv. Wykaza´c, ˙ze w ka ˙zdej grze i dla ka ˙zdego gracza istnieje co najmniej jedna strategia niezdominowana, o ile ka ˙zdy gracz ma sko ´nczon ˛ a liczb ˛e strategii.
v. Poda´c przykład gry z niesko ´nczon ˛ a liczb ˛ a strategii, w której gracz nie ma ani jednej strategii niezdominowanej.
(b) Przykład - góra/dół, lewo/prawo
gracz I\gracz II lewo prawo góra 7 ,1 5 ,2
dół 7 ,4 3 ,8
i. Czy gracze maj ˛ a strategie ´sci´sle/słabo dominuj ˛ ace?
(c) Przykład - dylemat wi˛e´znia Posta´c strategiczna dylematu wi ˛e´znia, który omówiony był wcze´sniej.
wi ˛ezie ´n I\wi ˛ezie ´n II współpracuje nie współpracuje
współpracuje 0,0 7, − 2
nie współpracuje − 2,7 5,5
i. Czy gracze maj ˛ a strategie ´sci´sle/słabo dominuj ˛ ace?
(d) Przykład - walka płci M ˛ a ˙z i ˙zona chc ˛ a zdecydowa´c, czy pój´s´c do opery czy na mecz piłki no ˙znej. M ˛ a ˙z najbardziej chciałby pój´s´c na mecz, natomiast ˙zona - do opery. Ka ˙zde z nich wolałoby sp ˛edzi´c wieczór wspólnie, ni ˙z oddzielnie
m ˛ a ˙z\ ˙zona mecz opera mecz 3,1 0,0 opera 0,0 1,3
i. Czy gracze maj ˛ a strategie ´sci´sle/słabo dominuj ˛ ace?
ii. Zaproponowa´c takie warto´sci wypłat, aby pasowały one do sytuacji:
A. M ˛ a ˙z jest najbardziej nieszcz ˛e´sliwy, kiedy idzie sam do opery.
B. M ˛ a ˙z jest zadowolony, kiedy idzie sam na mecz.
C. M ˛ a ˙z jest jeszcze bardziej zadowolony, kiedy idzie z ˙zon ˛ a do opery.
D. M ˛ a ˙z jest najbardziej zadowolony, kiedy idzie razem z ˙zon ˛ a na mecz.
E. Analogicznie dla ˙zony, przy czym nale ˙zy zamieni´c oper ˛e z meczem.
iii. Zaproponowa´c takie warto´sci wypłat, aby pasowały do sytuacji, w której ka ˙zdy z mał-
˙zonków woli by´c samotnie w swoim ulubionym miejscu, ni ˙z sp ˛edza´c czas wspólnie z drug ˛ a osob ˛ a, ale robi ˛ ac to, czego nie lubi ˛ a.
(e) Przykład - gra w monety Dwa gracze pokazuj ˛ a jednocze´snie dwie strony monety. Je´sli poka-
˙z ˛ a t ˛e sam ˛ a stron ˛e, to wygrywa pierwszy gracz. W przeciwnym przypadku wygrywa gracz drugi.
gracz I\gracz II orzeł reszka orzeł 1, − 1 − 1,1 reszka − 1,1 1, − 1
i. Czy gracze maj ˛ a strategie ´sci´sle/słabo dominuj ˛ ace?
(f) Przykład - gra w tchórza Dwie osoby jad ˛ a na przeciwko siebie ulic ˛ a. Ka ˙zdy z nich mo ˙ze przyj ˛ a´c jedn ˛ a z dwóch strategii: agresywn ˛ a lub pokojow ˛ a.
• Je´sli obie osoby przyjm ˛ a strategi ˛e agresywn ˛ a, to obie osoby ucierpi ˛ a w wyniku zderze- nia.
• Je´sli jedna z osób przyjmie strategi ˛e pokojow ˛ a, a druga agresywn ˛ a, to gracz wybieraj ˛ acy strategi ˛e agresywn ˛ a zdob ˛edzie uznanie w oczach znajomych, a drugi straci powa ˙zanie.
• Je´sli obie osoby stchórz ˛ a, obie strac ˛ a powa ˙zanie, ale b ˛ed ˛ a si ˛e cieszy´c, ˙ze nie doznały uszczerbku na zdrowiu.
gracz I\gracz II postawa agresywna postawa pokojowa
postawa agresywna − 1, − 1 10,0
postawa pokojowa 0,10 5,5
i. Czy gracze maj ˛ a strategie ´sci´sle/słabo dominuj ˛ ace?
(g) Przykład - wojna Dwóch dowódców ma do dyspozycji jednostki piechoty, które mog ˛ a by´c wysłane do ró ˙znych lokalizacji (A, B, C, D). Pierwszy dowódca dysponuje jednym oddziałem piechoty, a drugi - dwiema.
• Je ˙zeli jednostka przybywa na miejsce i nie napotyka tam jednostki wroga, to zdobywa ona dan ˛ a lokalizacj ˛e.
• Je´sli jednostki spotykaj ˛ a si ˛e w tej samej lokalizacji, to wybucha walka, która ko ´nczy si ˛e przegran ˛ a obu jednostek.
Zdobycie lokalizacji oznacza wypłat ˛e równ ˛ a 1, a przegrana - 0.
dowódca I\dowódca II A, B A, C A, D B, C B, D C, D A 0 ,1 0 ,1 0 ,1 1 ,2 1 ,2 1 ,2
B 0 ,1 1 ,2 1 ,2 0 ,1 0 ,1 1 ,2
C 1 ,2 0 ,1 1 ,2 0 ,1 1 ,2 0 ,1
D 1 ,2 1 ,2 0 ,1 1 ,2 0 ,1 0 ,1
i. Czy gracze maj ˛ a strategie ´sci´sle/słabo dominuj ˛ ace?
ii. Zało ˙zy´c, ˙ze dowódca II mo ˙ze tak ˙ze wysła´c oba oddziały do tej samej lokalizacji (np. (A, A), (B, B) itd.). Zapisa´c gr ˛e w postaci strategicznej. Wypisa´c przyj ˛ete zało ˙zenia.
iii. Zapisa´c posta´c strategiczn ˛ a gry w przypadku, gdy dwie pierwsze lokalizacje s ˛ a bardziej warto´sciowe, ni ˙z pozostałe (np. zdobycie tych lokalizacji daje wypłat ˛e podwójnej wyso- ko´sci).
(h) Przykład - gra koordynacyjna Trzech przyjaciół chce wspólnie sp ˛edzi´c wieczór. Spotkanie nie b ˛edzie udane je ˙zeli co najmniej jeden z nich si ˛e spó´zni.
gracz III przychodzi na czas
gracz I\gracz II przyj´s´c na czas spó´zni´c si˛e przyj´s´c na czas 1,1,1 0,0,0
spó´zni´c si˛e 0,0,0 0,0,0
gracz III spó´znia si ˛e
gracz I\gracz II przyj´s´c na czas spó´zni´c si˛e przyj´s´c na czas 0,0,0 0,0,0
spó´zni´c si˛e 0,0,0 0,0,0
i. Czy gracze maj ˛ a strategie ´sci´sle/słabo dominuj ˛ ace?
(i) Przykład - konkurencja cenowa Dwie firmy ustalaj ˛ a ceny towaru, na który popyt dany jest wzorem P = 6 − c, gdzie c jest ni ˙zsz ˛ a z cen.
• Firma, która ma ni ˙zsz ˛ a cen ˛e, zaspokaja cały popyt na towar.
• Je ˙zeli obie firmy ustal ˛ a tak ˛ a sam ˛ a cen ˛e towaru, to ka ˙zda z nich zaspokaja po połowie popytu.
• Mo ˙zliwe poziomy cen to: 0, 1,. . . , 6 zł.
• Przyj ˛ a´c zerowy koszt produkcji towaru.
i. Napisa´c posta´c strategiczn ˛ a gry przyjmuj ˛ ac, ˙ze ka ˙zda z firm troszczy si ˛e jedynie o swój własny zarobek.
ii. Pokaza´c, ˙ze strategia polegaj ˛ aca na ustaleniu ceny w wysoko´sci 5 zł słabo dominuje strategi ˛e odpowiadaj ˛ ac ˛ a cenie 6 zł.
iii. Dla poprzedniego podpunktu sprawdzi´c, czy zachodzi tak ˙ze ´scisła dominacja.
iv. Czy pierwsza firma posiada inne słabo zdominowane strategie?
v. Czy pierwsza firma posiada strategi ˛e dominuj ˛ ac ˛ a?
vi. Wykona´c zadanie od pocz ˛ atku przy zało ˙zeniu, ˙ze w przypadku, gdy obie firmy ustal ˛ a cen ˛e na takim samym poziomie, to pierwsza firma zaspokaja cały popyt (a druga firma pozostaje bez sprzeda ˙zy).
(j) Zadanie Poda´c przykład gry dla trzech graczy, w której:
i. dwóch graczy ma strategie dominuj ˛ ace, a trzeci nie ma, ii. tylko jeden gracz ma strategi ˛e dominuj ˛ ac ˛ a.
(k) Przykład - sprz ˛ atanie domu Dwoje mał ˙zonków mo ˙ze po´swi ˛eci´c swój czas na sprz ˛ atanie wspólnego domu.
• Oboje lubi ˛ a przebywa´c w czystym wn ˛etrzu, a wn ˛etrze staje si ˛e tym czystsze, im wi ˛ecej czasu mu po´swi ˛ecaj ˛ a.
• Ka ˙zdy z mał ˙zonków wolałby, ˙zeby druga osoba po´swi ˛eciła swój czas na sprz ˛ atanie.
• Ka ˙zdy z mał ˙zonków mo ˙ze po´swi ˛eci´c 0, 1, . . . 4 godziny.
• Je´sli ˙zona po´swi ˛eci x godzin, a m ˛ a ˙z y, ich wypłaty b ˛ed ˛ a wysoko´sci odpowiednio √
x + y − x i √
x + y − y.
i. Zapisa´c gr ˛e w postaci strategicznej.
ii. Pokaza´c, ˙ze strategia polegaj ˛ aca na sprz ˛ ataniu przez jedn ˛ a godzin ˛e słabo dominuje stra- tegi ˛e polegaj ˛ ac ˛ a na sprz ˛ ataniu przez dwie godziny.
iii. Dla poprzedniego podpunktu sprawdzi´c, czy zachodzi ´scisła dominacja.
iv. Czy ˙zona posiada strategi ˛e dominuj ˛ ac ˛ a?
v. Rozwi ˛ aza´c zadanie ponownie przy zało ˙zeniu, ˙ze u ˙zyteczno´s´c dla ˙zony wynosi 2 √
x + y − x.
2 . Równowaga w strategiach dominuj ˛ acych Kombinacja strategii jest równowag ˛ a w strategiach do- minuj ˛ acych (´sci´sle lub słabo) je ˙zeli ka ˙zdy gracz wybiera strategi ˛e dominuj ˛ ac ˛ a.
Mo ˙zna przewidywa´c, ˙ze gracze b ˛ed ˛ a wybiera´c strategie dominuj ˛ ace, bo s ˛ a one zawsze lepsze od innych strategii, niezale ˙znie od decyzji podejmowanych przez pozostałych graczy.
Je ˙zeli ka ˙zdy z graczy ma strategi ˛e dominuj ˛ ac ˛ a, to istnieje równowaga w strategiach dominuj ˛ a- cych.
Je ˙zeli chocia ˙z jeden z graczy nie ma strategii dominuj ˛ acej, gra nie ma równowagi w strategiach dominuj ˛ acych.
(a) Przykład - równowaga w strategiach dominuj ˛ acych Czy w poni ˙zszych grach istnieje rów- nowaga w strategiach dominuj ˛ acych?
i. Dylemat wi ˛e´znia
wi ˛ezie ´n I\wi ˛ezie ´n II współpracuje nie współpracuje
współpracuje 0,0 7, − 2
nie współpracuje − 2,7 5,5
ii. Walka płci
m ˛ a ˙z\ ˙zona mecz opera mecz 3,1 0,0 opera 0,0 1,3 iii. Gra w monety
gracz I\gracz II orzeł reszka orzeł 1, − 1 − 1,1 reszka − 1,1 1, − 1 iv. Gra
v. Wojna
3 . Najlepsza odpowied´z Strategia s
?ijest najlepsz ˛ a odpowiedzi ˛ a na wektor strategii s
?−ipozostałych graczy je ˙zeli
π
i( s
?i,s
?−i) ≥ π
i( s
i,s
?−i)
gracz I\gracz II lewo prawo góra 7 ,3 5 ,3
dół 7 ,0 3 ,-1
dowódca I\dowódca II A, B A, C A, D B, C B, D C, D A 0 ,1 0 ,1 0 ,1 1 ,2 1 ,2 1 ,2
B 0 ,1 1 ,2 1 ,2 0 ,1 0 ,1 1 ,2 C 1 ,2 0 ,1 1 ,2 0 ,1 1 ,2 0 ,1 D 1 ,2 1 ,2 0 ,1 1 ,2 0 ,1 0 ,1
dla wszystkich strategii s
i.
Najlepsza odpowied´z jest "strategi ˛ a dominuj ˛ ac ˛ a" w takim sensie, ˙ze jest najlepsz ˛ a strategi ˛ a pod warunkiem, ˙ze pozostali gracze wybior ˛ a kombinacj ˛e strategii s
?−i.
4 . Porównania w grach sko ´nczonych i grach sko ´nczonych dwuosobowych
5 . Eliminacja strategii zdominowanych Jak ju ˙z było wcze´sniej powiedziane, strategie zdominowane s ˛ a złe, strategie niezdominowane s ˛ a dobre. Gracz nie powinien wybiera´c strategii zdominowanej, poniewa ˙z zgodnie z definicj ˛ a, wypłata z tej strategii nigdy nie jest wy ˙zsza od wypłaty ze strategii j ˛ a dominuj ˛ acej.
W teorii gier zakłada si ˛e, ˙ze gracz post ˛epuje racjonalnie i d ˛ a ˙zy do maksymalizacji wypłaty, zatem na pewno nie wybierze strategii, o której z góry wiadomo, ˙ze jest gorsza od jakiej´s innej. T˛e zł ˛a strategi ˛e mo ˙zna wyeliminowa´c, czyli w ogóle nie bra´c jej pod uwag ˛e. Po wyeliminowaniu jednej ze strategii, warto od nowa przyjrze´c si ˛e grze i wypłatom, poniewa ˙z mo ˙zliwe jest, ˙ze w "zmniej- szonej" grze, jaka´s inna strategia oka ˙ze si ˛e zdominowana i j ˛ a tak ˙ze b ˛edzie mo ˙zna wyeliminowa´c.
Powtarzanie tego procesu tak długo, jak to mo ˙zliwe, to iterowana procedura eliminacji strategii zdominowanych.
6 . Iteracja i strategie racjonalizowane Stosuj ˛ ac iterowan ˛ a procedur ˛e eliminacji strategii zdominowa- nych, mo ˙zna czasem znale´z´c równowag ˛e całej gry. Taka równowaga nazywana jest równowag ˛ a w zakresie strategii racjonalizowanych.
(a) Przykład - góra/´srodek/dół, lewo/prawo Dana jest gra w postaci strategicznej:
gracz I\gracz II lewo prawo góra 1 ,1 0 ,1
´srodek 0 ,2 1 ,0 dół 0 ,-1 0 ,0
i. Czy gra posiada równowag ˛e w zakresie strategii racjonalizowanych?
(b) Przykład - model Bertranda Model Bertranda opisuje interakcje mi ˛edzy firmami w duopolu, które ustalaj ˛ a ceny i ich klientami, którzy wybieraj ˛ a ilo´sci po ustalonej cenie.
• Firmy mog ˛ a ustali´c ceny na jednym z trzech poziomów: niski, ´sredni, wysoki.
• Firma, która ustali ni ˙zsz ˛ a cen ˛e, przejmuje cały rynek.
• Je ˙zeli obie firmy ustal ˛ a jednakowe ceny, to ka ˙zda z nich zaspokaja połow˛e popytu.
Macierz wypłat:
firma I\firma II niska ´srednia wysoka wysoka 0 ,8 0 ,10 6 ,6
´srednia 0 ,8 5 ,5 10 ,0 niska 4 ,4 8 ,0 8 ,0
i. Czy gra posiada równowag ˛e w zakresie strategii racjonalizowanych?
(c) Przykład - model Bertranda II Dwie firmy w duopolu ustalaj ˛ a ceny towarów, dla których popyt dany jest zale ˙zno´sci ˛ a: p = 6 − c, gdzie c jest ni ˙zsz ˛ a z dwóch ustalonych cen.
• Firmy mog ˛ a ustali´c ceny w wysoko´sci 0 zł, 1 zł, 2 zł,. . . , 6 zł.
• Koszt produkcji wynosi zero.
• Firma, która ustali ni ˙zsz ˛ a cen ˛e, przejmuje cały rynek.
• Je ˙zeli obie firmy ustal ˛ a jednakowe ceny, to ka ˙zda z nich zaspokaja połow˛e popytu.
i. Pokaza´c, ˙ze ustalenie ceny na poziomie 0 zł i 6 zł to strategie zdominowane.
ii. Czy strategie polegaj ˛ ace na ustaleniu cen na poziomie 4 zł lub 5 zł s ˛ a zdominowane?
iii. Wykaza´c, ˙ze gdyby na rynku była tylko jedna firma, zysk w przypadku monopolu byłby maksymalny dla ceny równej 3 zł.
iv. Dlaczego firma w duopolu nigdy nie b ˛edzie chciała ustali´c ceny powy ˙zej poziomu ceny, któr ˛ a ustaliłaby w monopolu?
v. Znale´z´c rozwi ˛ azanie gry w strategiach racjonalizowanych.
(d) Przykład - model Bertranda III Uogólnienie poprzednich przykładów. Dwie firmy w du- opolu ustalaj ˛ a ceny towarów, dla których popyt dany jest zale ˙zno´sci ˛ a: p = f ( c ) , gdzie f ( c ) jest malej ˛ ac ˛ a funkcj ˛ a ceny. Przyj ˛ a´c, ˙ze c
mjest cen ˛ a w monopolu tak ˛ a, ˙ze c
m≥ 2 zł.
i. Pokaza´c, ˙ze ustalenie ceny powy ˙zej c
mjest strategi ˛ a zdominowan ˛ a.
ii. Pokaza´c, ˙ze ustalenie ceny na poziomie c
m− 1 dominuje cen ˛e c
m, czyli pokaza´c, ˙ze
1
2
f ( c
m) · c
m< f ( c
m− 1 ) · ( c
m− 1 ) .
iii. Pokaza´c, ˙ze je ˙zeli wiadomo, ˙ze ˙zadna z firm nie ustali ceny wy ˙zszej ni ˙z c, to cena c jest dominowana przez strategi ˛e polegaj ˛ ac ˛ a na ustaleniu ceny wysoko´sci c − 1, o ile c ≥ 2.
iv. Pokaza´c, ˙ze procedura iterowanej eliminacji strategii dominowanych prowadzi do roz- wi ˛ azania, w którym ka ˙zda firma ustala cen ˛e na poziomie 1 zł.
v. Przyj ˛ a´c, ˙ze koszt produkcji jest niezerowy. Wykaza´c, ˙ze zachodz ˛ a wyniki wykazane wy-
˙zej tak długo, jak cena c − 1 (przy której firma obsługuje cały popyt) jest bardziej opła- calne, ni ˙z dzielenie si ˛e popytem przy cenie c.
(e) Przykład - remont Agnieszka i Bartek chc ˛ a przeprowadzi´c remont mieszkania.
• Na to, ˙zeby remont był przeprowadzony dokładnie, potrzeba po´swi ˛eci´c ł ˛ acznie dwana-
´scie godzin pracy.
• Je ˙zeli po´swi ˛econe zostanie dziewi ˛e´c godzin pracy, remont zostanie przeprowadzony, ale niestarannie.
• Je ˙zeli po´swi ˛econe zostanie mniej ni ˙z dziewi ˛e´c godzin pracy, nie b ˛edzie wida´c efektów remontu.
• Ka ˙zda osoba mo ˙ze po´swi ˛eci´c na remont trzy, sze´s´c lub dziewi ˛e´c godzin.
Wypłaty ró ˙zni ˛ a si ˛e w zale ˙zno´sci od osoby:
• Oboje uwa ˙zaj ˛ a, ˙ze niestarannie przeprowadzony remont wart jest dwóch utyli.
• Agnieszka uwa ˙za, ˙ze:
– dokładnie przeprowadzony remont wart jest dziesi ˛eciu utyli;
– brak efektu remontu wart jest minus dziesi ˛e´c utyli.
• Bartek uwa ˙za, ˙ze:
– dokładnie przeprowadzony remont wart jest pi ˛eciu utyli.
– brak efektu remontu wart jest minus pi ˛e´c utyli.
• Wypłaty równe s ˛ a liczbie utyli pomniejszonej o liczb ˛e godzin pracy wło ˙zonej w remont.
i. Napisa´c posta´c strategiczn ˛ a gry.
ii. Czy gra posiada równowag ˛e w zakresie strategii racjonalizowanych?
7 . Strategie racjonalizowane - dyskusja
(a) Poziomy racjonalno´sci Mo ˙zna zało ˙zy´c, ˙ze ˙zaden gracz nie wybierze strategii, która jest zdo- minowana. Mo ˙zna tak ˙ze zało ˙zy´c, ˙ze ˙zaden gracz nie wybierze strategii, która b ˛edzie zdomi- nowana po wyeliminowaniu strategii zdominowanej. Takie zało ˙zenia wydaj ˛ a si ˛e racjonalne, ale na ile racjonalne jest zało ˙zenie, ˙ze gracze nie wybior ˛ a strategii, która oka ˙ze si ˛e zdomino- wana dopiero po kilku lub kilkunastu krokach iteracji? Czy gracz mo ˙ze zakłada´c tak dalece id ˛ ac ˛ a racjonalno´s´c pozostałych graczy? Problem pojawia si ˛e w sytuacji, gdy wypłaty gra- cza s ˛ a bardzo zró ˙znicowane i zbyt optymistyczne zało ˙zenie co do racjonalno´sci pozostałych graczy, mo ˙ze prowadzi´c do niskiej wypłaty.
(b) Przykład - zało˙zenie o racjonalno´sci graczy W tabeli przedstawiono gr ˛e w postaci strate- gicznej.
gracz I\gracz II lewo ´srodek prawo góra 8 ,10 2 ,12 10 ,12
´srodek 6 ,10 4 ,10 10 ,8 dół 4 ,10 4 ,0 14 ,0
i. Zakładaj ˛ ac, ˙ze gracze s ˛ a racjonalni, znale´z´c rozwi ˛ azanie gry w strategiach racjonalizo- wanych.
Uwaga: Gdyby gracz drugi wybrał strategi ˛e lewo, miałby zagwarantowan ˛ a wypłat ˛e wysoko-
´sci dziesi ˛e´c, co wydaje si ˛e kusz ˛ acym wyborem w porównaniu ze strategi ˛ a ´srodek, przy której istnieje ryzyko zerowej wypłaty. Wybór strategii ´srodek ma sens tylko w sytuacji, w której gracz drugi ma pewno´s´c, ˙ze gracz pierwszy nie wybierze strategii dół. Tak ˛ a pewno´s´c mo ˙zna uzyska´c w momencie, gdy gracz pierwszy b ˛edzie miał pewno´s´c, ˙ze gracz drugi nie wybierze strategii prawo.
Im wi ˛eksza liczba iteracji eliminacji strategii zdominowanych, tym poleganie na racjonalnych wyborach, wydaje si ˛e mniej pewnym rozwi ˛ azaniem.
8 . Kolejno´s´c eliminacji strategii słabo zdominowanych W przypadku strategii słabo zdominowa- nych, wynik gry mo ˙ze zale ˙ze´c od kolejno´sci eliminacji strategii (czyli do tego, czy eliminacj ˛e przeprowadza si ˛e jednocze´snie dla wszystkich graczy, czy dla ka ˙zdego kolejno oraz od wybranej kolejno´sci graczy). Iterowane eliminowanie strategii raz dla jednego, a nast ˛epnie dla drugiego gracza, mo ˙ze nie prowadzi´c do jednoznacznego rozwi ˛ azania, co wi ˛ecdo jakiego rozwi ˛ azania do prowadziej, mo ˙ze prowadzi´c do ró ˙znych rozwi ˛ aza ´n.
W przypadku eliminacji strategii ´sci´sle zdominowanych, powy ˙zszy problem nie wyst ˛epuje.
gracz I\gracz II lewo prawo góra 0 , 0 0 ,1
dół 1 ,0 0 ,0
(a) Przykład - kolejno´s´c eliminacji Macierz wypłat:
i. Wyeliminowa´c strategie zdominowane jednocze´snie dla obu graczy. Do jakiego rozwi ˛ a- zania to prowadzi?
ii. Wyeliminowa´c strategie zdominowane kolejno - najpierw dla gracza pierwszego (czy prowadzi to do jednoznacznego rozwi ˛ azania?), a nast ˛epnie dla gracza drugiego (czy prowadzi to do jednoznacznego rozwi ˛ azania?).
9 . Nieistnienie rozwi ˛ aza ´n Nie wszystkie gry posiadaj ˛ a rozwi ˛ azanie w strategiach racjonalizowa- nych.
(a) Przykład - nieistnienie rozwi ˛ aza ´n Macierz wypłat:
gracz I\gracz II lewo ´srodek prawo góra 1 ,-1 -1,1 0 ,-2
´srodek -1,1 1 ,-1 0 ,-2 dół -2,0 -2,0 -2,-2
i. Wyeliminowa´c strategie zdominowane. Czy w wyniku przeprowadzenia eliminacji, otrzy- muje si ˛e jednoznaczne rozwi ˛ azanie?
10 . Procedura iterowanej eliminacji strategii silnie zdominowanych W procedurze iterowanej elimi- nacji strategii silnie zdominowanych kolejno´s´c eliminacji nie ma znaczenia. Innymi słowy, je ˙zeli jednoczesna eliminacja strategii silnie zdominowanych prowadzi do rozwi ˛ azania, to do tego same- go rozwi ˛ azania prowadzi tak ˙ze eliminacja wielokrotnie powtarzana kolejno dla ka ˙zdego gracza.
Mo ˙ze si ˛e zdarzy´c, ˙ze procedura eliminacji strategii silnie zdominowanych nie prowadzi do rozwi ˛ a- zania, podczas gdy dałoby si ˛e wyeliminowa´c strategie słabo zdominowane i znale´z´c rozwi ˛ azanie w taki sposób.
(a) Przykład - strategie racjonalizowane - silna/słaba dominacja
i. Wykaza´c, ˙ze je ˙zeli eliminowany s ˛ a jedynie strategie silnie zdominowane, to rozwi ˛ aza- nie racjonalizowane nie zale ˙zy od kolejno´sci eliminacji. Dowód przeprowadzi´c dla gry dwuosobowej, w której ka ˙zdy gracz posiada trzy strategie.
ii. Poda´c własny przykład gry, w którym kolejno´s´c eliminacji strategii słabo zdominowa- nych wpływa na rozwi ˛ azanie w strategiach racjonalizowanych.
iii. Poda´c własny przykład gry, która ma rozwi ˛ azanie w strategiach racjonalizowanych:
A. w przypadku iterowanej eliminacji strategii silnie zdominowanych;
B. w przypadku iterowanej elimincji strategii słabo zdominowanych.
iv. Poda´c własny przykład gry, która ma rozwi ˛ azanie w strategiach racjonalizowanych mi- mo, ˙ze te strategie pocz ˛ atkowo nie dominuj ˛ a ˙zadnych innych strategii. Rozwi ˛ aza´c to zadanie w dwóch przypadkach:
A. w przypadku iterowanej eliminacji strategii silnie zdominowanych;
B. w przypadku iterowanej elimincji strategii słabo zdominowanych.
Równowagi Nasha
1 . Równowaga Nasha Wektor strategii s
?= s
?1,s
?2, . . . ,s
?Njest równowag ˛ a Nasha je ˙zeli π
i( s
?i,s
?−i) ≥ π
i( s
i,s
?−i)
dla wszystkich s
ii wszystkich i.
Gracz i, wybieraj ˛ ac strategi ˛e s
?i, wybiera najlepsz ˛a odpowied´z dla strategii wybranych przez innych graczy. To oznacza, ˙ze nie mo ˙ze on zwi ˛ekszy´c swojej wypłaty poprzez wybranie innej strategii, je ˙zeli pozostali gracze pozostan ˛ a przy swoim dotychczasowym wyborze. Tak jest dla ka ˙zdego i, czyli dla ka ˙zdego gracza - ˙zaden gracz nie ma motywacji do jednostronnej zmiany swojej decyzji, je ˙zeli pozostali nie zmieni ˛ a swoich wyborów.
Alternatywna definicja: w gdzie dwuosobowej równowaga Nasha to taka para strategii, w której ka ˙zda ze strategii jest najlepsz ˛ a odpowiedzi ˛ a dla pozostałej strategii z pary.
(a) Przykład - walka płci Najlepsze odpowiedzi dla gracza pierwszego:
m ˛ a ˙z\ ˙zona mecz (M) opera (O)
mecz (M) 3,1 0 ,0
opera (O) 0 ,0 1,3
Najlepsze odpowiedzi dla gracza drugiego:
m ˛ a ˙z\ ˙zona mecz (M) opera (O) mecz (M) 3 ,1 0 ,0 opera (O) 0 ,0 1 ,3
i. Uzasadni´c, ˙ze wypłaty wyró ˙znione w tabeli s ˛ a najlepszymi odpowiedziami: b
1( M ) = M, b
1( O ) = O, b
2( M ) = M, b
2( O ) = O.
ii. Uzasadni´c, ˙ze (M,M) i (O,O) s ˛ a równowagami Nasha.
(b) Przykład - dylemat wi˛e´znia Macierz wypłat:
wi ˛ezie ´n I\wi ˛ezie ´n II współpracowa´c nie współpracowa´c
współpracowa´c 0 ,0 7 ,-2
nie współpracowa´c -2,7 5 ,5
i. Uzasadni´c, ˙ze skoro strategia współpracowa´c jest strategi ˛ a dominuj ˛ ac ˛ a, to jest ona najlepsz ˛a odpowiedzi ˛a dla obu strategii drugiego wi ˛e´znia.
ii. Uzasadni´c, ˙ze para strategii (współpracowa´c, współpracowa´c) jest równowag ˛ a Nasha.
iii. Uzasadni´c, ˙ze para strategii (współpracowa´c, współpracowa´c) jest równowag ˛ a w strategiach racjonalizowanych.
(c) Przykład - model Bertranda Macierz wypłat:
i. Zaznaczy´c najlepsze odpowiedzi.
ii. Znale´z´c równowag ˛e Nasha.
iii. Uzasadni´c, ˙ze w tym przypadku równowaga Nasha równa jest równowadze racjonalizo-
wanej.
firma I\firma II wysoki ´sredni niski wysoki 6 ,6 0 ,10 0 ,8
´sredni 10 ,0 5 ,5 0 ,8 niski 8 ,0 8 ,0 4 ,4
Agnieszka\Bartek 3 godziny 6 godzin 9 godzin 3 godziny -13,-8 -1,-4 7 ,-4
6 godzin -4,-1 4 ,-1 4 ,-4 9 godzin 1 ,2 1 ,-1 1 ,-4
(d) Przykład - remont Macierz wypłat:
i. Zaznaczy´c najlepsze odpowiedzi.
ii. Znale´z´c równowagi Nasha.
iii. Która z równowag Nasha jest jednocze´snie równowag ˛ a w strategiach racjonalizowa- nych?
(e) Przykład - gra koordynacyjna Macierz wypłat:
gracz I\gracz II przyj´s´c na czas spó´zni´c si˛e przyj´s´c na czas 1 ,1 0 ,0
spó´zni´c si˛e 0 ,0 0 ,0
i. Zaznaczy´c najlepsze odpowiedzi.
ii. Znale´z´c równowagi Nasha.
(f) Zadanie
i. Poda´c przykłady gier, w których:
A. jest jedna równowaga Nasha, B. s ˛ a dwie równowagi Nasha, C. s ˛ a trzy równowagi Nasha.
ii. Uzasadni´c, ˙ze je ˙zeli iterowana eliminacja strategii ´sci´sle zdominowanych prowadzi do rozwi ˛ azania, to
A. rozwi ˛ azanie w strategiach racjonalizowanych jest równowag ˛ a Nasha, B. nie istniej ˛ a inne równowagi Nasha.
iii. Poda´c przykład gry (innej ni ˙z gra koordynacyjna), w której istnieje rozwi ˛ azanie w stra- tegiach racjonalizowanych i wi ˛ecej ni ˙z jedna równowaga Nasha.
(g) Przykład - wojna
dowódca I\dowódca II A, B A, C A, D B, C B, D C, D A 0 ,1 0 ,1 0 ,1 1 ,2 1 ,2 1 ,2
B 0 ,1 1 ,2 1 ,2 0 ,1 0 ,1 1 ,2 C 1 ,2 0 ,1 1 ,2 0 ,1 1 ,2 0 ,1 D 1 ,2 1 ,2 0 ,1 1 ,2 0 ,1 0 ,1
i. Znale´z´c równowagi Nasha.
(h) Przykład - sprz ˛ atanie domu Ka ˙zdy z dwóch graczy mo ˙ze po´swi ˛eci´c 0, 1, . . . , 4 godziny na sprz ˛ atanie domu. Je ˙zeli gracz pierwszy po´swi ˛eci x godzin, a gracz drugi y godzin, to wypłaty graczy wynios ˛ a odpowiednio √
x + y − x, √
x + y − y.
i. Znale´z´c najlepsz ˛ a odpowied´z gracza pierwszego dla ka ˙zdej strategii drugiego gracza.
ii. Znale´z´c równowagi Nasha.
iii. Jaki ł ˛ aczny czas powinien zosta´c po´swi ˛econy na sprz ˛ atanie, ˙zeby suma wypłat była najwy ˙zsza?
(i) Przykład - model Bertranda
• Popyt na towar dany jest zale ˙zno´sci ˛ a P = 6 − c, gdzie c oznacza ni ˙zsz ˛ a z dwóch cen ustalonych przez firmy w duopolu.
• Firma oferuj ˛ aca ni ˙zsz ˛ a cen ˛e zaspokaja cały popyt.
• Je ˙zeli obie firmy ustal ˛ a tak ˛ a sam ˛ a cen ˛e, to ka ˙zda z firm zaspokaja połow˛e popytu:
6−2c.
• Koszty produkcji towaru s ˛ a zerowe.
i. Pokaza´c, ˙ze najlepsz ˛ a odpowiedzi ˛ a dla ceny 4 zł jest cena monopolowa c
m= 3 zł.
ii. Jakie s ˛ a najlepsze odpowiedzi dla cen 5 zł i 4 zł?
iii. Pokaza´c, ˙ze najlepsz ˛ a odpowiedzi ˛ a dla ceny 3 zł s ˛ a 2 zł.
iv. Pokaza´c, ˙ze równowag ˛ a Nasha jest ustalenie przez ka ˙zd ˛ a z firm ceny na poziomie 1 zł.
v. Rozwi ˛ aza´c powy ˙zsze zadanie w przypadku, w którym byłyby na rynku trzy firmy.
vi. Rozwi ˛ aza´c powy ˙zsze zadanie w przypadku, w którym byłoby na rynku N firm.
(j) Przykład - model Bertranda II
• Popyt na towar dany jest zale ˙zno´sci ˛ a P = f ( c ) , gdzie c oznacza ni ˙zsz ˛ a z dwóch cen ustalonych przez firmy w duopolu, a f jest malej ˛ ac ˛ a funkcj ˛ a ceny.
• p
moznacza cen ˛e monopolow ˛ a i p
m≥ 2.
i. Pokaza´c, ˙ze je ˙zeli firma konkurencyjna ustala cen ˛e na poziomie wy ˙zszym ni ˙z cena mo- nopolowa, to najlepsz ˛ a odpowiedzi ˛ a jest ustalenie ceny p
m.
ii. Pokaza´c, ˙ze je ˙zeli firma konkurencyjna ustala cen ˛e p > 1 na poziomie p
mlub poni ˙zej, to najlepsz ˛ a odpowiedzi ˛ a jest ustalenie ceny poni ˙zej poziomu p (innymi słowy, na przykład ustalenie ceny p − 1 jest bardziej korzystne o przyj ˛ecia ceny p lub powy ˙zej).
iii. Uzasadni´c, ˙ze jedyn ˛ a równowag ˛ a Nasha jest przyj ˛ecie przez obie firmy ceny równej 1 zł.
(k) Przykład - gra w tchórza Macierz wypłat
gracz I\gracz II postawa agresywna postawa pokojowa
postawa agresywna x,x 10,0
postawa pokojowa 0,10 5,5
i. Znale´z´c równowag ˛e Nasha w przypadku, gdy
A. straty fizyczne w wyniku walki s ˛ a wi ˛eksze, ni ˙z oczekiwany zysk z wygranej, czyli dla wypłaty x zachodzi: x 0,
B. x 0.
ii.
2 . Strategie i zbiory kongruentne Zachowanie graczy mo ˙ze by´c skoordynowane (zgodne, kongru-
entne). Zgodno´s´c mo ˙ze odnosi´c si ˛e do sytuacji, w której gra grana jest wielokrotnie, a zachowania
graczy s ˛ a stałe i regularne, a tak ˙ze do sytuacji, w której gra jest jednokrotna, ale poprzedzona ko- munikacj ˛ a (przekonania graczy mog ˛ a by´c tak ˙ze kształtowane przez histori ˛e, czy inne czynniki, i przez to spójne ze sob ˛ a).
Zgodno´s´c mo ˙ze dotyczy´c przypadku, w którym ka ˙zdy gracz wybiera jedn ˛ a strategi ˛e b ˛ed ˛ ac ˛ a naj- lepsz ˛ a odpowiedzi ˛ a na strategie pozostałych graczy i jednocze´snie wierzy, ˙ze pozostali gracze wybior ˛ a swoje strategie analogicznie. W ten sposób wybrane strategie s ˛ a wzajemnie najlepszymi odpowiedziami. Tak wybrany profil strategii jest równowag ˛ a Nasha.
W niektórych sytuacjach oczekiwanie, ˙ze gracze b ˛ed ˛ a tak mocno skoordynowani, ˙ze wybior ˛ a je- den profil strategii, nie ma racji bytu. Mo ˙ze to wynika´c z braku zewn ˛etrznej instytucji, która wpływałaby na koordynacj ˛e przekona ´n graczy, lub fakt, ˙ze wybór pojedy ´nczego profilu strategii mo ˙ze nie by´c spójny zachowaniem graczy, maj ˛ acych tendenj ˛e do wybierania najlepszej odpowie- dzi.
Niech X = X
1× . . . × X
n, gdzie X
is ˛ a podzbiorami zbiorów strategii S
i. Zbiór profili strategii X jest słabo kongruentny je ˙zeli dla ka ˙zdego gracza i ka ˙zda strategia w X
ima racjonalne uzasad- nienie dla X
−i(czyli istnieje przekonanie o takim wyborze strategii przez pozostałych graczy, ˙ze strategia s
ijest dla nich najlepsz ˛ a odpowiedzi ˛ a). X jest kongruentny je ˙zeli X
izawieraj ˛ a dokładnie te strategie, które maj ˛ a racjonalne uzasadnienie.
(a) Przykład - zbiory kongruentne I Macierz wypłat:
gracz I\gracz II a b c x 8 ,6 6 ,8 0 ,0 y 6 ,8 8 ,6 0 ,0 z 0 ,0 0 ,0 5 ,5
Nie zawsze racjonalnie jest oczekiwa´c, ˙ze wszyscy gracze zgodz ˛ a si ˛e skoordynowa´c na jed- nym profilu strategii (tak, jak to jest w równowadze Nasha). Tak mo ˙ze by´c w przypadku, gdy wypłaty w równowadze Nasha s ˛ a ni ˙zsze ni ˙z te, które gracze otrzymaliby, gdyby podj ˛eli inne decyzje.
i. Znale´z´c równowag ˛e Nasha.
ii. Czy w tym przypadku wybór równowagi Nasha jest racjonalny? Innymi słowy, czy gdy- by gracze mogli porozumie´c si ˛e przed gr ˛ a, to zdecydowaliby si ˛e na wybór strategii (c,z)?
iii. Co by było, gdyby gracze skoordynowali si ˛e i wspólnie zdecydowali nie wybiera´c stra- tegii (c,z)?
Taki rodzaj koordynacji nie mo ˙ze by´c uchwycony za pomoc ˛ a równowagi Nasha, poniewa ˙z w tej grze jest tylko jedna równowaga Nasha.
(b) Przykład - zbiory kongruentne II Macierz wypłat:
gracz I\gracz II a b c x 5 ,2 3 ,4 8 ,4 y 6 ,2 2 ,3 8 ,8 z 1 ,1 0 ,1 9 ,2
i. Znale´z´c równowagi Nasha.
ii. Która równowaga jest efektywna (tj. maksymalizuje "dobrobyt społeczny", czyli ł ˛ aczne wypłaty wszystkich graczy)?
iii. Czy zbiór X = { x,y } × { b,c } jest słabo kongruentny?
Je ˙zeli gracz pierwszy wierzy, ˙ze gracz drugi wybierze strategi ˛e b lub c, to wybierze x lub z.
Strategii z nie ma w profilu X. Zatem profil strategii X nie jest słabo kongruentny.
3 . Równowaga w grze partnerstwa
• W grze bierze udział dwóch graczy, którzy dziel ˛ a si ˛e wypracowanym zyskiem.
• Zysk dany jest zale ˙zno´sci ˛ a p = 4 ( x + y + cxy ) , gdzie x oznacza wysiłek wło ˙zony przez pierwszego gracza, y wysiłek wło ˙zony przez drugiego gracza, przy czym x,y ∈ [ 0,4 ] , a c ∈ ( 0,4 ) jest stał ˛ a, która wyra ˙za jak dopełniaj ˛ a si ˛e wysiłki obu graczy (gdyby c = 0 wtedy nie byłoby sensu współpracy, bo efekt byłby sum ˛ a wysiłków ka ˙zdego z graczy).
• Gracze ponosz ˛ a koszt od wkładanego wysiłku. Pierwszy gracz ponosi koszt wysoko´sci x
2, a drugi wysoko´sci y
2.
• Nie ma mo ˙zliwo´sci spisania kontraktu, który gwarantowałby wło ˙zenie okre´slonego wysiłku w prac ˛e.
• Ka ˙zdy z partnerów chce zmaksymalizowa´c swój zysk, czyli gracz pierwszy d ˛ a ˙zy do maksy- malizacji warto´sci
p2− x
2, a drugi:
2p− y
2.
• Zbiory strategii s ˛ a niesko ´nczone dlatego nie mo ˙zna zapisa´c gry w postaci tablicy.
• Trzeba sprawdzi´c co jest najlepsz ˛ a odpowiedzi ˛ a gracza pierwszego na ka ˙zd ˛ a mo ˙zliw ˛ a decy- zj ˛e gracza drugiego.
• W przypadku niesko ´nczonej przestrzeni strategii, warto przyjrze´c si ˛e wykresowi przedsta- wiaj ˛ acemu najlepsze odpowiedzi dla ka ˙zdego z graczy.
• Najlepsza odpowied´z gracza pierwszego na decyzj ˛e y gracza drugiego to taka strategia, która maksymalizuje wypłat ˛e:
max
x2 ( x + y + cxy ) − x
2W celu jej znalezienia, trzeba obliczy´c pierwsz ˛ a pochodn ˛ a funkcji wypłaty po x:
2 ( 1 + cy ) − 2x
Przy strategii, która jest najlepsz ˛ a odpowiedzi ˛ a, pochodna b ˛edzie równa zero:
2 ( 1 + cy ) − 2 ˆx = 0 co po przekształceniu daje
ˆx = 1 + cy = BR
1( y ) .
Uwaga: Dla ˆx wypłata jest maksymalna (a nie minimalna), bo druga pochodna funkcji wy- płaty po x jest ujemna ( − 2 < 0).
• Analogicznie dla drugiego gracza:
ˆy = 1 + cx = BR
2( x ) .
• W grach, w których zbiór najlepszych odpowiedzi jest jednoelementowy, mo ˙zna traktowa´c BR
ijako funkcj ˛e i pisa´c ˆx = BR
1( y ) zamiast ˆx ∈ BR
1( y ) .
• Wykres najlepszych odpowiedzi.
Rysunek 1: Wykres najlepszych odpowiedzi graczy.
– Wykresami s ˛ a proste, poniewa ˙z zale ˙zno´s´c mi ˛edzy zmiennymi jest liniowa, a w zwi ˛ az- ku z tym wystarczy wyznaczy´c najlepsze odpowiedzi tylko dla dwóch warto´sci (dwa punkty wystarcz ˛ a do narysowania prostej).
– Je ˙zeli gracz drugi wybiera strategi ˛e zero, to najlepsz ˛ a odpowiedzi ˛ a gracza pierwszego jest 1 + c · 0 = 1.
– Je ˙zeli gracz drugi wybiera strategi ˛e cztery, to najlepsz ˛ a odpowiedzi ˛ a gracza pierwszego jest 1 + c · 4 = 1 + 4c.
– Wykres najlepszych odpowiedzi dla gracza drugiego jest symetryczny wzgl ˛edem prostej y=x.
– Jak korzysta´c z wykresu? Znale´z´c na osi pionowej wybran ˛ a warto´s´c y strategii gracza drugiego, przej´s´c poziomo do wykresu prostej BR
1( y ) , a nast ˛epnie zej´s´c pionowo w dół do dolnej osi, z której odczyta´c warto´s´c najlepszej odpowiedzi x gracza pierwszego.
• Jak ju ˙z wiadomo, gracze nie powinni wybiera´c strategii, które nie s ˛ a najlepszymi odpowie- dziami na strategie wybrane przez innych.
• Z wykresu wida´c, ˙ze najlepsze odpowiedzi graczy zawieraj ˛ a si ˛e w przedziale [ 1,1 + 4c ] . War- to´sci spoza tego przedziału nie s ˛ a najlepszymi odpowiedziami dla ˙zadnych strategii innego gracza (innymi słowy, na przykład gracz drugi nie ma takiej strategii, dla której najlepsz ˛ a odpowiedzi ˛ a gracza pierwszego byłoby wybranie strategii mniejszej od jeden lub wi ˛ekszej od 1 + 4c). Nale ˙zy wyeliminowa´c strategie spoza przedziału [ 1,1 + 4c ] .
• Po wyeliminowaniu strategii spoza przedziału [ 1,1 + 4c ] wykres przedstawia si ˛e nast ˛epuj ˛ aco:
• Przygl ˛ adaj ˛ ac si ˛e nowemu wykresowi wida´c, ˙ze najlepszymi odpowiedziami dla "skrajnych"
strategii s ˛ a:
– dla strategii 1, strategia 1 + c · 1 = 1 + c,
– dla strategii 1 + 4c, strategia 1 + c ( 1 + 4c ) .
Rysunek 2: Na niebiesko zaznaczono strategie, które nie s ˛ a najlepszymi odpowiedziemi i podlegaj ˛ a eliminacji.
Rysunek 3: Wykres najlepszych odpowiedzi po wyeliminowaniu strategii spoza przedziału [ 1,1 + 4c ]
• Strategie spoza przedziału [ 1 + c,1 + c ( 1 + 4c )] były najlepszymi odpowiedziami dla pew- nych strategii, ale ju ˙z nie s ˛ a, bo strategie, dla których były one najlepszymi odpowiedziami, zostały wcze´sniej wyeliminowane. W zwi ˛ azku z tym nale ˙zy wyeliminowa´c strategie spoza wskazanego przedziału.
• Eliminuj ˛ ac strategie w analogiczny sposób po niesko ´nczonej liczbie kroków wynik zbiegnie do punktu, w którym proste si ˛e przecinaj ˛ a: x
?= 1 + cy
?, y
?= 1 + cx
?. Z faktu, ˙ze gra jest symetryczna wynika, ˙ze x
?= y
?. St ˛ ad:
x
?= y
?= 1 1 − c .
Wybieraj ˛ ac powy ˙zszy profil strategii, ka ˙zdy gracz gra najlepsz ˛ a odpowied´z, czyli ˙zaden z nich nie ma motywacji, ˙zeby wybra´c inn ˛ a strategi ˛e, je´sli jego partner nie zmieni swojego wyboru. Zatem znalezione rozwi ˛ azanie jest równowag ˛ a Nasha.
• Czy wybieraj ˛ ac ten profil strategii gracze pracuj ˛ a wydajnie, czy poni ˙zej lub powy ˙zej poziomu najbardziej wydajnej pracy? Parnerzy wiedz ˛ a, ˙ze wkładany przez nich wysiłek nie przekłada si ˛e w cało´sci na zysk, poniewa ˙z ponoszony koszt jednostki wysiłku daje tylko połow˛e wy- pracowanego zysku (zysk dzielony jest na połow˛e pomi ˛edzy graczy). Z tego powodu gracze maj ˛ a tendencj ˛e do wkładania mniejszego wysiłku i ich praca nie jest tak wydajna, jak by mogła by´c, gdyby istniał pomi ˛edzy nimi spisany kontrakt.
• Im mniejsza warto´s´c parametru c odpowiadaj ˛ acego za synergi ˛e, tym wykres najlepszej od- powiedzi BR
1( y ) bardziej pionowy, a wykres BR
2( x ) bardziej poziomy. Punkt przeci ˛ecia wykresów przesuwa si ˛e na lewo i w dół, co oznacza, ˙ze gracz pierwszy wie, ˙ze gracz drugi b ˛edzie wkładał mniej pracy, gracz drugi wie, ˙ze gracz pierwszy b ˛edzie wkładał mniej pra- cy, gracz pierwszy wie, ˙ze gracz drugi wie itd. W rezultacie partnerzy b ˛ed ˛ a wkłada´c mniej pracy, a ł ˛ aczny efekt b ˛edzie jeszcze mniej wydajny, ni ˙z przy wy ˙zszej warto´sci parametru c.
• Najbardziej wydajne rozwi ˛ azanie jest wtedy, kiedy ł ˛ aczna warto´s´c wypłat jest najwi ˛eksza.
˙Zeby znale´z´c to rozwi ˛azanie nale ˙zy zmaksymalizowa´c funkcj ˛e b ˛ed ˛ac ˛a sum ˛a wypłat obu graczy
max
x,y4 ( x + y + cxy ) − x
2− y
2.
Po obliczeniu pochodnych cz ˛ astkowych funkcji wzgl ˛edem x i y i po przyrównaniu ich do zera otrzymujemy:
4 + 4cy = 2x, 4 + 4cx = 2y.
St ˛ ad najbardziej efektywne rozwi ˛ azanie jest dla strategii ˆx = 2
1 − 2c , ˆy = 2 1 − 2c .
Jak wida´c
1−1c<
1−22c, wi ˛ec w strategiach racjonalizowanych gracze wkładaj ˛ a mniej wysiłku ni ˙z potrzeba do tego, aby uzyska´c rozwi ˛ azanie najbardziej efektywne.
(a) Przykład - gra partnerstwa Rozwa ˙zy´c gr ˛e partnerstwa opisan ˛ a powy ˙zej. Rozwa ˙zy´c dwa przypadki:
i. c < 0, ii. c >
14.
Dla ka ˙zdego przypadku
i. narysowa´c wykres funkcji najlepszych odpowiedzi,
ii. wyja´sni´c czy ró ˙zni si ˛e on od przypadku omówionego powy ˙zej,
iii. korzystaj ˛ ac z wykresu znale´z´c rozwi ˛ azanie w strategiach racjonalizowanych.
4 . Równowagi Nasha w strategiach mieszanych
• Wypłata ze strategii mieszanej to ´srednia wa ˙zona wypłat ze strategii czystych, wi ˛ec najwi ˛ek- sza wypłata jest zawsze uzyskiwana kiedy gra si ˛e strategi ˛e czyst ˛ a.
• Z powy ˙zszego wynika, ˙ze w´sród najlepszych odpowiedzi na strategi ˛e mieszan ˛ a znajduje si ˛e przynajmniej jedna strategia czysta.
• (Twierdzenie) Strategia mieszana gracza jest najlepsz ˛ a odpowiedzi ˛ a na strategie mieszane pozostałych graczy je ˙zeli ka ˙zda strategia czysta w jej no´sniku jest najlepsz ˛ a odpowiedzi ˛ a na te mieszane strategie innych graczy.
• ´Sci´sle zdominowana strategia czysta nigdy nie wyst ˛epuje w no´sniku równowagi Nasha w strategiach mieszanych (nie dotyczy to strategii słabo zdominowanej).
• Gry dwuosobowe o sumie zero:
– (Twierdzenie (von Neumann 1928)) Ka ˙zda sko ´nczona gra dwuosobowa o sumie zerowej ma przynajmniej jedn ˛ a równowag ˛e Nasha w strategiach mieszanych. S ˛ a to mieszane strategie maksyminowe.
– (Twierdzenie (Julia Robinson)) Je ˙zeli dwóch graczy gra wielokrotnie w gr ˛e o sumie zero w postaci normalnej i w ka ˙zdej rundzie gracze wybieraj ˛ a najlepsze odpowiedzi w strate- giach czystych na obserwowane mieszane strategie innych graczy, to mieszane strategie zbiegaj ˛ a do pary strategii mieszanych tworz ˛ acych równowag ˛e Nasha.
• (Twierdzenie (John F. Nash 1950)) Ka ˙zda gra sko ´nczona ma przynajmniej jedn ˛ a równowag ˛e Nasha w strategiach czystych lub mieszanych.
(a) Przykład - kamie ´n-no˙zyce-papier
• W grze kamie ´n-no ˙zyce-papier nie ma równowagi Nasha w strategiach czystych.
• Je ˙zeli w grze wyst ˛epuje równowaga Nasha w strategiach czystych, gracze chcieliby za- komunikowa´c swoj ˛ a strategi ˛e innym przed rozpocz ˛eciem gry i tym samym zwi ˛ekszy´c szanse, ˙ze równowaga zostanie osi ˛ agni ˛eta.
• W grze kamie ´n-no ˙zyce-papier kluczowe jest, aby pozostawi´c drugiego gracza w niepew- no´sci co do wybranej strategii. Celem jest zaskoczenie przeciwnika, co najłatwiej zrobi´c poprzez zaskoczenie samego siebie, czyli przez podejmowanie decyzji losowo, stosuj ˛ ac strategie mieszane.
• Macierz wypłat gracza pierwszego:
gracz I\gracz II kamie ´n no˙zyce papier
kamie ´n 0 1 -1
no˙zyce -1 0 1
papier 1 -1 0
i. Zagra´c w gr ˛e kamie ´n-no ˙zyce-papier i uzyska´c przewag ˛e trzypunktow ˛ a:CoproRobot1a.
ii. Przyj ˛ a´c, ˙ze gracz pierwszy wybrał strategi ˛e mieszan ˛ a: 50% kamie ´n, 25% no ˙zyce, 25%
papier. Uzasadni´c, ˙ze oczekiwane wypłaty gracza pierwszego przeciwko strategiom czy-
stym gracza drugiego s ˛ a takie, jak w tabeli.
gracz I\gracz II kamie ´n no˙zyce papier
kamie ´n 0 1 -1
no˙zyce -1 0 1
papier 1 -1 0
50-25-25 mix 0 0 ,25 -0,25
iii. Przyj ˛ a´c dodatkowo, ˙ze gracz drugi wybiera strategi ˛e mieszan ˛ a: 25% kamie ´n, 50% no ˙zyce, 25 % papier. Uzasadni´c, ˙ze oczekiwane wypłaty gracza pierwszego przeciwko tej strategii mieszanej gracza drugiego s ˛ a takie, jak w tabeli.
gracz I\gracz II kamie ´n no˙zyce papier 25-50-25 mix
kamie ´n 0 1 -1 0 ,25
no˙zyce -1 0 1 0
papier 1 -1 0 -0,25
50-25-25 mix 0 0 ,25 -0,25 0 ,0625
iv. Do poprzedniego podpunktu: dlaczego fakt, ˙ze warto´s´c w prawym dolnym rogu tabeli jest nieujemna, nie powinien by´c zaskoczeniem?
v. Wymy´sli´c dobr ˛ a strategi ˛e przeciwko graczowi, który w grze kamie ´n-no ˙zyce-papier gra strategi ˛e mieszan ˛ a 25% kamie ´n, 50% no ˙zyce, 25% papier. Zweryfikowa´c swój pomysł graj ˛ ac w gr ˛e CoproRobot1b i uzyskuj ˛ ac przewag ˛e trzypunktow ˛ a.
(b) Przykład - walka płci Macierz wypłat: Przyj ˛ a´c, ˙ze m ˛ a ˙z wybiera oper˛e z prawdopodobie ´n- m ˛ a ˙z\ ˙zona mecz opera
mecz 3 ,1 0 ,0 opera 0 ,0 1 ,3
stwem
13, a ˙zona gra strategi ˛e czyst ˛ a mecz.
i. Jakie jest prawdopodobie ´nstwo tego, ˙ze oboje mał ˙zonkowie wybior ˛ a mecz?
ii. Jakie jest prawdopodobie ´nstwo tego, ˙ze m ˛ a ˙z pójdzie samotnie do opery?
iii. Jaka jest oczekiwana wypłata m ˛e ˙za?
Przyj ˛ a´c, ˙ze m ˛ a ˙z wybiera oper˛e z prawdopodobie ´nstwem
13, a ˙zona gra strategi ˛e czyst ˛ a opera.
i. Jaka jest oczekiwana wypłata m ˛e ˙za?
ii. Czy wypłata m ˛e ˙za, który wybiera strategi ˛e mieszan ˛ a, zale ˙zy od strategii wybranej przez
˙zon ˛e?
Przyj ˛ a´c, ˙ze m ˛ a ˙z wybiera oper˛e z prawdopodobie ´nstwem
13, a ˙zona wybiera oper˛e z prawdopo- dobie ´nstwem
12.
i. Uzasadni´c, ˙ze oczekiwana wypłata m ˛e ˙za wynosi
13· 3 +
16· 0 +
13· 0 +
16· 1 =
76. (c) Zadania
i. Macierz wypłat:
A. Gracz pierwszy wybiera strategi ˛e A z prawdopodobie ´nstwem
23, a drugi zawsze wybiera strategi ˛e B. Obliczy´c oczekiwan ˛ a wypłat ˛e gracza pierwszego.
B. Gracz pierwszy wybiera strategi ˛e A z prawdopodobie ´nstwem p, a drugi zawsze
wybiera strategi ˛e B. Obliczy´c oczekiwan ˛ a wypłat ˛e gracza pierwszego.
gracz I\gracz II A B A 1 ,-1 -1,1 B -1,1 1 ,-1
C. Gracz pierwszy wybiera strategi ˛e A z prawdopodobie ´nstwem p, a drugi zawsze wybiera strategi ˛e A. Obliczy´c oczekiwane wypłaty graczy.
ii. Macierz wypłat:
gracz I\gracz II A B A -1,-1 10 ,0 B 0 ,10 5 ,5
A. Gracz pierwszy wybiera strategi ˛e A z prawdopodobie ´nstwem
119, a drugi zawsze wybiera strategi ˛e A. Obliczy´c oczekiwan ˛ a wypłat ˛e gracza pierwszego.
B. Gracz pierwszy wybiera strategi ˛e A z prawdopodobie ´nstwem
119, a drugi zawsze wybiera strategi ˛e B. Obliczy´c oczekiwan ˛ a wypłat ˛e gracza pierwszego.
C. Gracz pierwszy wybiera strategi ˛e A z prawdopodobie ´nstwem
119, a drugi wybiera strategi ˛e A z prawdopodobie ´nstwem
35. Wykaza´c, ˙ze oczekiwana wypłata gracza pierwszego wynosi
17355. Obliczy´c oczekiwan ˛ a wypłat ˛e drugiego gracza.
iii. Macierz wypłat:
gracz I\gracz II B
1B
2B
3B
4A
11 ,0 4 ,2 2 ,4 3 ,1 A
22 ,4 2 ,0 2 ,2 2 ,1 A
34 ,2 1 ,4 2 ,0 3 ,1
A. Gracz pierwszy wybiera strategie A
1, A
2, A
3z prawdopodobie ´nstwami odpowiednio 0 ,2, 0,3, 0,5, a drugi wybiera strategie B
1i B
3z prawdopodobie ´nstwami odpowiednio 0 ,4 i 0,6. Wykaza´c, ˙ze oczekana wypłata gracza pierwszego wynosi 2,32. Obliczy´c oczekiwan ˛ a wypłat ˛e gracza drugiego.
B. Gracz pierwszy wybiera strategie A
1, A
2, A
3z prawdopodobie ´nstwami odpowiednio p
1, p
2, p
3, a drugi wybiera strategie B
1i B
3z prawdopodobie ´nstwami odpowiednio q i 1 − q. Obliczy´c oczekiwan ˛ a wypłat ˛e gracza pierwszego.
(d) Przykład - równowaga w strategiach mieszanych, gra 2x2 Macierz wypłat:
gracz I\gracz II lewo prawo
Góra 0 1
Dół -1 0
i. Znale´z´c równowag ˛e Nasha w strategiach mieszanych. Odnie´s´c otrzymany wynik do trzech mo ˙zliwych przypadków:
A. gracz pierwszy stosuje strategi ˛e mieszan ˛ a, a gracz drugi - strategie czyste,
(wskazówka: Granie strategii czystej lewo jest równowa ˙zne graniu strategii mieszanej
100 %-0%. Gdyby dla takiej strategii mieszanej drugiego gracza mo ˙zliwa była równo-
waga Nasha, jakie równanie powinno zachodzi´c dla oczekiwanych wypłat gracza
pierwszego?)
B. gracz drugi stosuje strategi ˛e mieszan ˛ a, a gracz pierwszy - strategie czyste, C. obaj gracze stosuj ˛ a strategie mieszane.
(e) Przykład - równowaga w strategiach mieszanych, gra 3x3 Macierz wypłat:
gracz I\gracz II lewo centrum prawo góra 3 ,4 1 ,2 4 ,1
´srodek 4 ,2 2 ,2 1 ,4 dół 3 ,1 4 ,3 2 ,4
i. Znale´z´c równowag ˛e Nasha w strategiach mieszanych. Odnie´s´c otrzymany wynik do 49 mo ˙zliwych przypadków:
A. gracz pierwszy stosuje strategi ˛e mieszan ˛ a, w której no´sniku s ˛ a trzy strategie (jeden przypadek),
(wskazówka: przyj ˛ a´c za prawdopodobie ´nstwa poszczególnych strategii p
1, p
2, ( 1 − p
1− p
2) (dla gracza pierwszego) i q
1, q
2, 1 − q
3(dla gracza drugiego). Rozwi ˛ aza´c układ czterech równa ´n liniowych. Czy wyliczone warto´sci mog ˛ a by´c warto´sciami prawdopodobie ´nstwa?)
B. gracz pierwszy stosuje strategi ˛e mieszan ˛ a, w której no´sniku s ˛ a dwie strategie (trzy przypadki),
Wskazówka: Gracz pierwszy: dwie strategie czyste w no´sniku strategii mieszanej;
Gracz drugi: trzy strategie czyste w no´sniku strategii mieszanej
• przyj ˛ a´c na pocz ˛ atek, ˙ze gracz pierwszy miesza wył ˛ acznie strategie góra i ´srodek z prawdopodobie ´nstwami odpowiednio p i 1 − p, a drugi gracz miesza wszystkie trzy strategie z prawdopodobie ´nstwami q
1, q
2, 1 − q
1− g
2. Rozwi ˛ aza´c powstały układ trzech równa ´n. Czy układ ma rozwi ˛ azanie ze wzgl ˛edu na zmienn ˛ a p?
• Co si ˛e dzieje w przypadku, gdy pierwszy gracz miesza strategie góra i dół (czy zbiór rozwi ˛ aza ´n jest sko ´nczony?)?
• Cztery pozostałe przypadki tego typu prowadz ˛ a do sprzecznych układów równa ´n.
Wskazówka c.d.: Gracz pierwszy: dwie strategie czyste w no´sniku strategii miesza- nej; Gracz drugi: strategia czysta
• W równowadze Nasha prawdopodobie ´nstwo wybrania strategii czystej z no´snika strategii mieszanej jest tak dobrane, aby oczekiwane wypłaty z ka ˙zdej ze strategii czystych były równe. W tym przypadku w kolumnie odpowiadaj ˛ acej strategii wy- branej przez drugiego gracza powinny by´c dwie równowagi Nasha w strategiach czystych - czy co´s takiego tutaj ma miejsce?
Wskazówka c.d.2: Gracz pierwszy: dwie strategie czyste w no´sniku strategii miesza- nej; Gracz drugi: dwie strategie czyste w no´sniku strategii mieszanej
• Ten przypadek sprowadza si ˛e do przypadku gier danych macierzami 2x2.
C. gracz pierwszy stosuje strategie czyste (trzy przypadki), (wskazówka:
D. analogiczne siedem przypadkow dla gracza drugiego.
(f) Zadania
i. Znale´z´c równowagi Nasha w strategiach mieszanych.
A. Macierz wypłat:
B. Macierz wypłat:
gracz I\gracz II lewo prawo Góra 1 ,4 2 ,1
Dół 4 ,1 2 ,3 gracz I\gracz II lewo prawo
Góra 1 ,2 2 ,3 Dół 2 ,1 2 ,3
ii. Znale´z´c jak najwi ˛ecej równowag Nasha.
A. Macierz wypłat:
gracz I\gracz II B
1B
2B
3A
13 ,2 1 ,1 2 ,3 A
22 ,3 3 ,2 1 ,1 A
31 ,1 2 ,3 3 ,2 B. Macierz wypłat:
gracz I\gracz II B
1B
2B
3A
13 ,3 1 ,2 3 ,1 A
24 ,2 2 ,2 1 ,4 A
33 ,1 3 ,3 2 ,3
5 . Gry ´sci´sle konkurencyjne i strategie bezpiecze ´nstwa
• ´Sci´sle konkurencyjna (antagonistyczna) gra dwuosobowa jest to taka gra dwuosobowa, ˙ze dla ka ˙zdych dwóch profilów strategii s,s
0∈ S, u
1( s ) > u
1( s
0) wtedy i tylko wtedy u
2( s ) <
u
2( s
0) .
• Przykład:
gracz I\gracz II X Y A 3 ,2 0 ,4
B 6 ,1 1 ,3
• Gracz maj ˛ a dokładnie przeciwstawne rankingi mo ˙zliwych wyników (je´sli wypłata jednego gracza ro´snie, to wypłata drugiego gracza maleje).
• Brak mo ˙zliwo´sci wspólnych korzy´sci i kompromisu.
• Mo ˙zliwe wyniki w grze ´sci´sle konkurencyjnej:
– gracz 1 wygrywa, a gracz 2 przegrywa, – gracz 2 wygrywa, a gracz 1 przegrywa, – gracze remisuj ˛ a.
Gracze wol ˛ a wygra´c ni ˙z zremisowa´c i zremisowa´c ni ˙z przegra´c.
• Najgorsza wypłata, jak ˛ a mo ˙ze uzyska´c gracz i, stosuj ˛ ac strategi ˛e s
i: w
i( s
i) ≡ min
sj∈Sj
u
i( s
i,s
j) .
Jest to najgorsza wypłata na przestrzeni wszystkich mo ˙zliwych strategii gracza j przy zało ˙ze- niu, ˙ze gracz i wybiera strategi ˛e s
i. Je ˙zeli gracz i wybiera strategi ˛e s
i, to ma zagwarantowan ˛ a wypłat ˛e co najmniej w
i( s
i) .
• Strategia s
i∈ S
igracza i nazywa si ˛e strategi ˛ a bezpiecze ´nstwa, gdy maksimum max
si∈Siw
i( s
i) jest osi ˛ agane w s
i.
• Poziomem bezpiecze ´nstwa gracza i jest liczba max
si∈Siw
i( s
i) = max
si∈Si