• Nie Znaleziono Wyników

Uwagi wstępne

W dokumencie Wstęp do teorii gier – MIM UW (Stron 38-41)

6. Gry Bayesa

6.1. Uwagi wstępne

W dotychczas rozpatrywanym modelu gry strategicznej gracze którzy podejmowali decyzje mie-li pełną informację dotyczącą gry, w szczególności znamie-li macierze wypłat wszystkich graczy. W wielu rzeczywistych sytuacjach w ekonomii, w polityce, w konfliktach militarnych, w relacjach społecznych gracze mają zróznicowaną informację o pewnych aspektach gry, istotnych dla pod-jęcia decyzji o wyborze akcji. Gry w których przynajmniej jeden gracz posiada taka informację, tzn. nieznana conajmniej jednemu innemu graczowi, będziemy nazywać grami Bayesa (Bayesian games), albo grami z niepełną informacją. Używa się też terminu: gry z asymetryczną informacją. W dotychczasowych rozważaniach dla GS gracze znali w szczególności akcje i wypłaty swoje i przeciwników. W rzeczywistych konfliktach często tak nie jest, walczący nie znaja siły prze-ciwników, firmy nie znaja kosztów produkcji konkurentów, uczestnicy aukcji nie znają waluacji obiektu aukcji przez innych uczestników aukcji. W grach opisujących takie sytuacje dochodzi więc element ryzyka związany z niepełną informacją.

W grach Bayesa definicja równowagi Nasha musi zostać zmieniona tak aby uwzględnić zróżnico-waną informację graczy o grze. Odpowiednie uogólnienie pojęcia równowagi będziemy nazywali równowagą Nasha–Bayesa, lub po prostu równowagą Bayesa. W takiej równowadze akcje graczy będa optymalne (będą najlepszymi odpowiedziami) przy ich określonych przekonaniach (beliefs) dotyczących innych graczy.

W formalnym modelu gry strategicznej uwzględniającym niepełną informację dojda dodatko-we obiekty–stany świata, i subiektywne, zależne od gracza prawdopodobieństwa wystąpienia różnych stanów świata. Odpowiednim modyfikacjom ulegną wypłaty, które będą wartościami oczekiwanymi odpowiednich zmiennych losowych, i w konsekwencji pojęcia najlepszej odpowie-dzi.

Uwaga 6.1. Innym rodzajem niepełnej informacji o grze może być brak informacji gracza co inni

gracze wiedzą o tym co wie dany gracz na temat gry. W grach ekstensywnych, będących tematem kolejnych rozdziałów, rozważa się jeszcze inny rodzaj niepewności w grze: brak pewności jaka akcję grał ostatnio przeciwnik (przeciwnicy). Gry tego typu nazwiemy grami z niedoskonałą informacją (imperfect information).

W poniższych przykładach (por. [17]) rozważymy gry dwuosobowe w których przynajmniej jeden gracz nie będzie miał pewności na temat wypłat swojego przeciwnika czy też partnera gry.

Przykład 6.1 (Duopol Cournota z asymetryczną informacją). Niech C1(q1) = cq1 jest funkcja kosztów 1-ej firmy. Funkcja kosztów 2-ej jest równa C2(q2) = cLq2 z prawdopodobieństwem p,

C2(q2) = cHq2 z prawdopodobieństwem 1 − p. Informacja graczy o grze jest asymetryczna w nastepującym sensie: 2 zna C2 and C1, 1 zna C1 i wie że koszt koszt wyprodukowania jednostki towaru przez firmę 2 wynosi cL z prawdopodobieństwem p, cH z prawdopodobieństwem 1 −

p. Przykładowo, firma 2 może dopiero wchodzić na rynek lub wprowadzać nową technologię

produkcji rozważanego towaru. Zakładamy ”common knowledge”: 1 wie co 2 wie o grze, 2 wie że 1 wie co 2 wie o grze itd.

Przykład 6.2. Walka Płci (przy niepełnej informacji)

6.2. Definicje 39 Rozważmy symetryczną GS: N = {1, 2}, A1 = A2 = {B, S}. 1-y gracz to Mężczyzna, 2-i gracz to Kobieta. B oznacza Boks, S–Siatkówkę. 1 and 2 muszą zdecydować jednocześnie: wybrać B czy S.

Gracz 1 ma macierz wypłat

B S

B 2 0

S 0 1

Gracz 2 może być jednym z dwóch typów: l i h (od ang.: love, hate). Gdy jest typu l to jego macierz wypłat ma postać

B S B 1 0 S 0 2 a gdy typu h, to B S B 0 2 S 1 0

W tym przykładzie gracz 1 ma tylko jeden typ. Zakładamy że przy realizacji gry każdy gracz wie jakiego jest typu.

Gracz 1 nie wie z jakim typem gracza 2 będzie grał. Zakładając prawdopodobieństwo każdego typu równe (w naszym przykładzie) 0.5 i wiedząc jaką akcję wybierze (z prawdopodobieństwem 1) gracz 2 gdy jest każdego z typów, gracz 1 może obliczyć wypłaty ze swoich strategii czystych jako wartości oczekiwane zmiennej losowej ”typ gracza 2”.

Niech para (A,B) oznacza: gracz 2 gra A gdy jest typu l, B gdy jest typu h. Otrzymujemy macierz wartości oczekiwanych wypłat gracza 1 przy danych założeniach o graczu 2:

(B,B) (B,S) (S,B) (S,S)

B 2 1 1 0

S 0 1/2 1/2 1

Zauważmy że macierz tę można traktować jako macierz wypłat pewnej gry trzyosobowej. Za profil strategii czystych gry przyjmiemy trójkę

(X, A, B) ≡ (X, (A, B)), X, A, B ∈ {B, S}.

Za profil rówowagowy (strategii czystych) przyjmiemy taki profil (X, (A, B)) dla którego: 1. Przy ustalonych akcjach (A,B) 2-ego gracza gdy jest typu odpowiednio l, h (i przy znanym graczowi 1 prawdopodobieństwie każdego typu gracza 2 (w maszym przykładzie 0.5) akcja X daje graczowi 1 maksymalna wypłatę

2. Przy ustalonej akcji X 1-ego: gdy 2-i jest typu l (typu h) to akcja A (akcja B) daje 2-emu maksymalna wypłatę.

Jak łatwo sprawdzić, w naszym przykładzie warunki te spełnia trójka (B, (B, S)).

6.2. Definicje

Definicja 6.1. Przekonanie (belief) µi gracza i (o akcjach pozostałych graczy) jest to rozkład prawdopodobieństwa na A−i.

Gracz i jest racjonalny jeżeli wybiera strategię ai taką że

40 6. Gry Bayesa czyli taką która maksymalizuje wyrażenie

X ˜ ai

uiai, a−ii(a−i).

Przykładowo {(C, 0.6), (D, 0.4)} jest przekonaniem gracza 1 w grze koordynacyjnej

C D

C 1 0

D 0 1

Gracz 1 jest racjonalny jeżeli wybiera C.

Definicja 6.2. Niech Ω będzie zbiorem skończonym. Elementy Ω bedziemy nazywać stanami

świata. Przekonanie µi gracza i o stanach świata jest to rozkład prawdopodobieństwa na Ω.

Definicja 6.3. Gra Bayesowska

GB = hN, Ω, (Ai, Ti, τi, pi, ui)i∈Ni ,

składa się z następujących elementów:

N = {1, ...n} – skończony zbiór graczy.

Ω – skończony zbiór stanów świata. Dla każdego gracza i ∈ N określamy

— Ai – zbiór akcji gracza i. — Ti = {t1i, ..., tki

i } – skończony zbiór ki typów gracza i (sygnałów które może otrzymać). W dalszym ciągu dla uproszczenia górny wskaźnik numerujący typ będziemy pomijać.

— τi : Ω → Ti – funkcja sygnału gracza i. Przyporządkowuje ona stanom świata typ gracza

i.

Moc zbioru stanów które generują ryp ti opisuje stopień pewności gracza i o stanie świata. Na przykład jeżeli τi1) 6= τi2) ∀ω1, ω2 ∈ Ω to gracz i wie, po otrzymaniu sygnału, jaki

jest stan świata (jaki stan ”zaszedł”), a zatem zna typy wszystkich graczy.

Jeżeli natomiast τi1) = τi2) ∀ω1, ω2∈ Ω to sygnął który otrzymuje gracz (a zatem jego

typ) nie daje mu żadnej informacji o stanie świata.

W pozostałych przypadkach informacja ma charakter częściowy. Niech np. świat ma trzy stany: Ω = {ω1, ω2, ω3}, τi1) 6= τi2) = τi3). Jeżeli świat jest w stanie ω1, to gracz i wie że świat jest w stanie ω1, jesli ω2 lub ω3 to gracz i nie wie w którym z tych stanów. — Dla każdego typu ti Pi = P r(ω|ti) jest prawdopodobieństwem apriori (prior belief) jakie

typ ti assigns stanowi ω.

Funkcja sygnału τi wraz ze zbiorem prawdopodobieństw apriori opisują wiedzę i o stanie świata.

— ui : A × Ω → <, A = ×Ai, i ∈ N – funkcja wypłat gracza i.

Gra odbywa się w następstwie realizacji pewnego stanu świata ω ∈ Ω.

Gracz i otrzymuje sygnał (dla uproszczenia oznaczeń pomijamy numer sygnału) ti = τi(ω), czyli jest typu ti. Typ ti definiuje podzbiór stanów świata τi−1(ti) (które implikują typ ti). Dla każdego takiego stanu ω ∈ τi−1(ti) otrzymujemy P r(ω|ti) - aprioryczne prawdobodobieństwa gracza i w stanie ti że stan świata jest ω. Mając te prawdopodobieństwa obliczamy wypłaty gracza i.

Przykład 6.3. W rozpatrywanej grze Walka Płci (przy niepełnej informacji):

N = {1, 2}

W dokumencie Wstęp do teorii gier – MIM UW (Stron 38-41)

Powiązane dokumenty