TEORIA GIER W EKONOMII WYKŁAD 5: GRY DWUOSOBOWE KOOPERACYJNE O SUMIE NIESTAŁEJ dr Robert Kowalczyk Katedra Analizy Nieliniowej Wydział Matematyki i Informatyki UŁ Gry dwumacierzowe Skończoną grę dwuosobową o sumie dowolnej można wyrazić jako parę macierzy [ai,j] oraz [bi,j] o wymiarach mxn lub równoważnie jako macierz (A,B) o wymiarach mxn, której elementami są uporządkowane pary (ai,j,bi,j). Elementy ai,j oraz ai,j,bi,j oznaczają, odpowiednio wypłaty (w jednostkach użyteczności ) graczy I oraz II, przy założeniu, że stosują oni, odpowiednio, i-tą i j-tą strategię czystą. Gra w tej postaci nazywa się też grą dwumacierzową. Rozróżniamy dwa dwumacierzowych: przypadki niekooperacyjne (bez współpracy), kooperacyjne (ze współpracą). gier (a1,1,b1,1) (a1,2,b1,2) (a1,3,b1,3) (a2,1,b2,1) (a2,2,b2,2) (a2,3,b2,3) Strategie mieszane i punkty równowagi Przez strategie mieszane graczy I i II rozumiemy, odpowiednio, m-wymiarowe i nwymiarowe wektory x=(x1, x2,…,xm) i y =(y1, y2,…,yn) nieujemnych liczb, których suma wynosi 1. Powiemy, że para strategii mieszanych (x*,y*) gry dwumacierzowej (A,B) jest w równowadze, jeśli dla wszystkich innych strategii mieszanych x i y zachodzą nierówności: xAy*t ≤x*Ay*t oraz x*Byt ≤x*By*. Twierdzenie (Nash) Każda gra dwumacierzowa o sumie niestałej ma co najmniej jedną parę strategii w równowadze. Czy para strategii w równowadze to rozwiązanie gry? A B A (3,3) (0,4) B (4,0) (1,1) Para strategii (B,B) jest w równowadze. Wypłata (1,1) odpowiadająca tej strategii nie jest wypłatą optymalną. Lepiej było wybrać parę strategii (A,A) i wypłatę (3,3). A B A (4,1) (0,0) B (0,0) (1,4) Pary strategii (A,A) oraz (B,B) są w równowadze jednak nie są one wymienne ani nie dają tych samych wypłat. Gracze nie potrafią zdecydować którą ze strategii wybrać. A B A (2,2) (2,2) B (2,2) (2,2) Pary strategii (A,A), (A,B), (B,A) i (B,B) są w równowadze. Są wymienne i dają te same wypłaty. Każda z nich jest rozwiązaniem gry. Kryterium Pareto Powiemy, że wynik gry (wypłata) jest optymalny w sensie Pareto (paretooptymalny) jeżeli nie ma w grze innego wyniku (wypłaty), który byłby dla jednego gracza wyższy, a dla drugiego nie niższy. B A (3,3) (0,4) B (4,0) (1,1) Punkty paretooptymalne AB Aby stwierdzić, że dany punkt jest paretooptymalny, wystarczy sprawdzić czy punkt ten leży na północno-wschodnim boku wielokąta rozpiętego na wszystkich punktach (wartościach) gry dwuosobowej. A BB AA BA Kryterium Pareto Najczęściej przyjmujemy, że gra dwuosobowa o sumie niezerowej jest rozwiązywalna (w ścisłym sensie), gdy: ma co najmniej jedną równowagę Nasha, wypłata odpowiadająca tej równowadze jest optymalna w sensie Pareto, równowagi są wymienne i prowadzą do wypłat o tej samej wartości. Rozwiązaniem gry (o ile istnieje) można nazwać każdą z równowag (strategii mieszanych (x*,y*)) spełniających powyższe warunki. Punkty równowagi a strategie dominujące A B A (2,3) (3,2) B (1,0) (0,1) Jeżeli gracz I zagra strategię A (dominuje ona strategię B gdyż 2>1 oraz 3>0), to gracz II powinien wybrać strategię A, żeby wygrać więcej 3>2. Rozwiązaniem jest zatem para strategii (A,A), które jak łatwo zauważyć są w równowadze. Oczywiście w tym przypadku wypłata odpowiadająca tej parze strategii jest optymalna w sensie Pareto. Gry bez równowagi w strategiach czystych (strategie wyrównujące) A B A (2,4) (1,0) B (3,1) (0,4) W tej grze nie ma równowagi (w strategiach czystych). Brak również strategii dominujących. Szukamy najpierw strategii (x1,x2) dla gracza I (tzw. strategii wyrównującej). tzn. gracz I patrzy na grę gracza II i wybiera tak wektor (x1,x2) aby gracz II niezależnie od tego czy zagra A czy B to osiągnął ten sam zysk. Dostajemy zatem układ równań: 4x1+x2= 0x1+4x2 x1+x2= 1. Gra gracza I A B Szukamy teraz strategii (y1,y2) dla gracza II (tzw. strategii wyrównującej). tzn. gracz II patrzy na grę gracza I i wybiera tak wektor (y1,y2) aby gracz II niezależnie od tego czy zagra A czy B to osiągnął ten sam zysk. A 2 1 Dostajemy zatem układ równań B 3 0 Gra gracza II A B A 4 0 B 1 4 Strategia dla gracza I jest zatem postaci (3/7A,4/7B). 2y1+y2= 3y1+0y2 y1+y2= 1. Strategia dla gracza II jest zatem postaci (1/2A,1/2B). Oczywiście wartość gry (3/2,16/7) odpowiadająca tej równowadze nie jest optymalna w sensie Pareto (więcej byśmy uzyskali wybierając np. parę strategii (A,A)). Gry bez równowagi w strategiach czystych (strategie wyrównujące) Mając wyliczone strategie każdego z graczy możemy policzyć wypłatę każdego z nich. Możemy zrobić to na dwa sposoby. Sposób I Przemnażając wektor strategii gracza I (3/7A,4/7B) przez dowolny wektor wypłaty gracza II, tzn. (4,1) jeśli zagra strategię A lub (0,4) jeśli zagra strategię B widzimy, że gracz II wygrywa 16/7. Przemnażając wektor strategii gracza II (1/2A,1/2B) przez dowolny wektor wypłaty gracza I, tzn. (2,1) jeśli zagra strategię A lub (3,0) jeśli zagra strategię B widzimy, że gracz II wygrywa 3/2. Sposób II A B A (2,4) (1,0) B (3,1) (0,4) Gra gracza I A B A 2 1 B 3 0 Gra gracza II A B A 4 0 B 1 4 Wypłatę gracza I i II znajdziemy następująco: 3/7 3/7 2 1 1/2 3 0 1/2 4 0 1/2 3/2 4/7 16/7 4/7 1 4 1/2 Strategie bezpieczeństwa W tej grze nie ma równowagi (w strategiach czystych). Brak również strategii dominujących. Gracz I obawiając się, że gracz II będzie minimalizował jego wypłatę sam stara się minimalizować swoje straty. Zagra zatem w swojej grze strategię minimaksową (tzw. strategią bezpieczeństwa). Ponieważ jego gra ma punkt siodłowy, więc zagra strategię A. Wówczas dostanie on wypłatę co najmniej 1 (jest to jego tzw. poziom bezpieczeństwa). Gracz II obawiając się, że gracz I będzie minimalizował jego wypłatę sam stara się minimalizować swoje straty. Zagra zatem w swojej grze strategię minimaksową (tzw. strategię bezpieczeństwa). Ponieważ jego gra nie ma punktu siodłowego szukamy jego strategii mieszanej. Dostajemy strategię (4/7A,3/7B) i wartość gry gracza II co najmniej 16/7 (jest to jego tzw. poziom bezpieczeństwa). Gracz I gra zatem strategię (1A,0B) a gracz II strategię (4/7A,3/7B). Wówczas ich wypłata będzie równa (11/7,16/7). Ten punkt też nie jest jednak optymalny w sensie Pareto (można dostać więcej grając na przykład (A,A)). 1 2 1 4/7 3 0 3/7 11/7 0 4 1 0 4/7 16/7 0 1 4 3/7 A B A (2,4) (1,0) B (3,1) (0,4) Gra gracza I A B A 2 1 B 3 0 Gra gracza II A B A 4 0 B 1 4 Strategie kontrbezpieczeństwa Rozpatrzmy jeszcze raz grę z poprzedniego slajdu. Jeżeli gracz I gra swoją strategię bezpieczeństwa (rozgrywa swoją grę metodą minimax), to wybierze strategię A. Jeżeli gracz II to przewidzi, to też zagra strategię A. Wówczas gracz I dostaje wypłatę 2, a gracz II wypłatę 4, co jest dla każdego z nich korzystniejsze niż granie przez każdego z nich swoich strategii bezpieczeństwa. Jeżeli z kolei gracz II gra swoją strategię bezpieczeństwa (rozgrywa swoją grę metodą minimax), to wybierze strategię mieszaną (4/7A,3/7B) i wówczas jego wygrana wyniesie 16/7. Jeżeli gracz I to przewidzi, to obliczy swoje wypłaty dla swojej strategii A i strategii B: gracz I gra A: 4/7*2+3/7*1=11/7 A B A (2,4) (1,0) B (3,1) (0,4) Gra gracza I A B A 2 1 B 3 0 Gra gracza II A B A 4 0 B 1 4 gracz I gra B: 4/7*3+3/7*0=12/7 Gracz I powinien zatem wybrać strategię B i wówczas dostanie 12/7. To rozwiązanie (12/7,16/7) jest oczywiście lepsze dla obu graczy niż granie przez każdego z nich ich strategii bezpieczeństwa. Strategię najlepszej odpowiedzi na strategię bezpieczeństwa przeciwnika nazywamy strategią kontrbezpieczeństwa. O grach 2x2 Można wykazać, że każda gra dwuosobowa 2×2 o sumie niezerowej spełnia jeden z poniższych warunków: ma jedną równowagę, ma dwie równowagi w strategiach czystych, ma trzy równowagi: dwie w strategiach czystych i jedną w strategiach mieszanych, ma nieskończenie wiele równowag w tym: dwie, trzy lub cztery w strategiach czystych. Którą zatem z nich wybrać jeśli jest ich więcej niż jedna? Którą równowaga najlepsza? Harsányi i Selten zaproponowali sposób wyboru „najlepszej” równowagi dla gier 2×2, w których występują dwie równowagi w strategiach czystych położone na przekątnej tablicy wypłat oraz jedna równowaga w strategiach mieszanych. Reguła Seltena i Harsányi: ze wszystkich równowag gracze powinni wybrać równowagę dominującą ze względu na wypłaty, jeżeli nie ma równowagi dominującej ze względu na wypłaty, gracze powinni wybrać równowagę dominującą ze względu na ryzyko. Równowaga dominująca ze względu na wypłaty Powiemy, że równowaga Nasha dominuje ze względu na wypłaty jeśli wypłata każdego z graczy (dla tej równowagi) jest największa ze zbioru wypłat danego gracza dla wszystkich innych równowag Nasha (czystych lub mieszanych). A B A (8,6) (2,2) 6-2=4 1/3 B (2,2) (6,4) 4-2=2 2/3 8-2=6 6-2=4 2/5 3/5 10/3 22/5 Optymalną strategią jest strategia czysta (A,A). Gracz I dostaje wypłatę 8 (8>6 i 8>22/5). Gracz II dostaje wypłatę 6 (6>4 i 6>10/3). Strategie (A,A) jest strategią dominującą ze względu na wypłaty. Równowaga dominująca ze względu na ryzyko Powiemy, że równowaga Nasha dominuje ze względu na ryzko jeśli odznacza się najmniejszym ryzykiem związanym z wyborem poszczególnych strategii. Gracz I zakłada, że gracz II używa strategii C z prawdopodobieństwem q, a strategii C D A (9,5) (1,1) 5-1=4 4/5 B (1,1) (7,17) 17-1=16 1/5 9-1=8 7-1=6 3/7 4/7 22/5 31/7 D z prawdopodobieństwem 1-q. Wypłata gracza I wynosi: 9q+1(1-q)=8q+1 gdy gracz I gra A 1q+7(1-q)=7-6q gdy gracz I gra B Ponieważ gracz I preferuje strategię A, więc 8q+1>7-6q, skąd q>3/7. Gracz II zakłada, że gracz I używa strategii B z prawdopodobieństwem p, a strategii A z prawdopodobieństwem 1-p. Wypłata gracza II: 1p+5(1-p)=5-4p gdy gracz II gra A 17p+1(1-p)=16p+1 gdy gracz II gra B Ponieważ gracz II preferuje strategię B, więc 16p+1>5-4p, skąd p>1/5. Gracz I woli równowagę strategia A, strategia C. Żeby gracz I wybrał strategię A, prawdopodobieństwo użycia strategii C przez gracza II musi być większe niż 3/7 . Gracz II woli równowagę strategia B, strategia D. Żeby gracz II wybrał strategię D, prawdopodobieństwo użycia strategii B przez gracza 1 musi być większe niż 1/5 Ponieważ 1/5<3/7, więc gracz II ma poważniejsze powody by wybrać strategię B niż gracz I strategię A. Zagrane zostanie zatem (B,A) i wypłaty graczy będą (7,17). Równowaga (B,A) jest dominująca ze względu na ryzyko. DZIĘKUJĘ ZA UWAGĘ dr Robert Kowalczyk Wydział Matematyki i Informatyki UŁ