Wstęp do Teorii Gier Biologia Prosty model konfliktu wg Maynarda Smitha i Price'a. • Dwa osobniki jednego gatunku spotykają się w sposób losowy • Każdy z nich chce pewne dobro, ale tylko jeden je dostanie • Zdobycie dobra warte jest 50 punktów dostosowawczych – na przykład zwiększenie prawdopodobieństwa przekazania swoich genów następnemu pokoleniu. • Dwie strategie: – Jastrząb - walczy o dobro – Gołąb - ogranicza się do działań symbolicznych Gra gołąb-jastrząb • • • • Zdobycie dobra +50 Przegrana w walce -100 Strata czasu ma straszenie się -10 Zatem: – jastrząb walczący z jastrzębiem - 0.5*50+0.5*(-100)=25 – Jastrząb z gołębiem 50 – Gołąb z jastrzębiem 0 – Gołąb z gołębiem 0.5*(50-10)+0.5*(-10)=15 Strategia stabilna ewolucyjnie • Jeśli są same gołębie, to opłacałoby się być jastrzębiem • Jeśli są same jastrzębie, opłacałoby się być gołębiem • Strategia 7/12 jastrząb 5/12 gołąb jest stabilna ewolucyjnie • Strategia jest stabilna ewolucyjnie, jeśli spełnia: Niech T będzie jakąkolwiek inną strategią czystą lub mieszaną. Załóżmy, że wszystkie osobniki grają S za wyjątkiem niewielkiej liczby tych, co grają T. Jeśli S jest SSE, to oczekiwana wypłata graczy grających S jest nie mniejsza niż oczekiwana wypłata graczy grających T. • Znaczy to tyle, że populacja S jest odporna na inwazję mutantów T. Strategia stabilna ewolucyjnie P2 • B jest jedyną ESS P1 A B P2 • A i B są ESS P1 A B P2 • Tylko mieszana ESS P1 A B A B 1 3 2 4 A B 3 2 1 4 A B 1 2 4 3 Strategia stabilna ewolucyjnie • Ogólnie dla gier 2x2: – A jest ESS, jeśli a>c, lub a=c i b≥d – B jest ESS, jeśli d>b, lub d=b i c≥a – Inaczej tylko mieszana P2 P1 A B A B a c b d • Jeśli jest więcej niż dwie strategie, to – strategia czysta S jest stabilna ewolucyjnie, jeśli na głównej przekątnej dla strategii S jest wartość najwyższa w tej kolumnie – ponieważ wtedy S jest najlepszą strategią przeciwko sobie samej S. – Jeśli wartość na przekątnej nie jest jedyną największą wartością w kolumnie, potrzebny jest dalszy test: Wtedy S musi być niegorsza przeciwko jakiejkolwiek alternatywie niż ta alternatywa jest dla siebie samej Znęcający się nad słabszymi • Jeśli jest więcej niż dwie strategie, czysta strategia S jest SSE, jeśli wartość wypłaty dla S leżąca na głównej przekątnej macierzy gry jest największą wartością w swojej kolumnie • Dodajmy strategię „gnębiciel” – atakuj jeśli przeciwnik się nie broni, uciekaj kiedy atakuje (jeśli dwóch gnębicieli się spotka, jeden z nich ucieknie szybciej niż pozostały) • Gołąb jest zdominowany • Jedyna SSE to ½ jastrzębia, ½ gnębiciela • Jak najlepiej radzić sobie z gnębicielem? Mściwy typ • Dodajmy strategię „mściciel” – na początku graj gołębia, ale jeśli cię ktoś atakuje walcz z nim z całej siły • Mściciel jest SSE • Również SSE jest strategia mieszana - mniej niż 30% gołębia, reszta mściciel (jeśli będzie więcej niż 30% gołębi, gnębiciel dokona inwazji) • W populacji mścicieli nie dochodzi do walki – ten rodzaj pokojowej równowagi zachodzi dzięki gotowości do walki Mściwy typ • Are we jumping to conclusions too soon??? – We should check ALL conditional strategies in fact. • However, the retaliator strategy is very robust. – To do better against a retaliator than another retaliator would do, you would have to win the resource from him without wasting time or risking injury. This is difficult because a retaliator will not run away, and if you fight him, he will fight back. Another conclusion?? – Conditional strategies seem to do better than mechanical strategies Efektywność i koordynacja 7 5 1 7 5 (25) (50) 6 (0) (15) 12 12 4 12 12 • • • • Wynik nieoptymalny w sensie Pareto Gdyby grali gołębia, mieliby po 15 A gdyby grali ½ GJ, ½ GJ to mieliby po 25 Jak skoordynować działanie: – – – – Walcz tylko wtedy, gdy jesteś większy Walcz tylko wtedy, gdy masz dłuższy ogon Walcz tylko wtedy, gdy jaśniejsze pierze Walcz tylko wtedy, gdy jesteś na swoim terytorium 50 Symetryczny wynik paretooptymalny 25 GG -25 SSE 25 -25 50 Mieszczuch • Rozpatrzmy strategię „posiadacza” – bądź jastrzębiem na własnym terytorium, a gołębiem na cudzym • Załóżmy, że połowa starć na własnym terytorium oraz że dwa osobniki nigdy nie spotkają się na terytorium nienależącym do któregoś z nich • Dwie SSE – Mściciel dopuszczający istnienie pewnej liczby gołębi – Posiadacz dopuszczający istnienie pewnej liczby gnębicieli Exercise [Dawkins (1976)] • • • • • a) b) c) d) e) A bird female tries to get a male to stay around and help raise a family of babies, instead of going off and propagating his genes elsewhere. One possible technique is to insist on a long and arduous courtship before mating. Suppose a female can be either coy (insist on courtship) or fast (be willing to mate with anyone) A a male can be either faithful (go through a courtship and then help raise the babies) or philandering (be unwilling to go through a courtship, and desert any female after mating) Suppose the payoff to each parent of babies is +15, the total cost of raising babies is 20, which can be split equally between both parents, or fall entirely on the female if the male deserts. Suppose the cost of a long courtship is -3 to each player. Formulate the resulting game Draw the movement diagram of this game to show there is no pure strategy equilibrium A mixed strategy ESS for males would be one which equilizes the expected payoffs to coy and fast females. Find it. Similarly, find an ESS for the females. If males and females follow these ESS’s, what will the epxected payoffs be? Is this result Pareto optimal? Gry Bayesowskie • Gry z niepełną informacją (incomplete information), gdzie gracze poruszają się jednocześnie • Co jest nowego z grze Bayesowskiej: – Każdy gracz ma jakiś typ (type), który podsumowuje jego prywatną informację – Każdy gracz dokonuje oceny (belief) typów innych graczy – Wypłaty graczy zależą od typów – Różne typy tego samego gracza mogą grać różne strategie Gry w postaci strategicznej Gra z pełną informacją Gra z niepełną informacją 1. 2. Zbiór graczy: Zbiór akcji dla każdego gracza: 1. 2. Zbiór graczy: Zbiór typów dla każdego gracza: 3. Funkcja wypłat dla każdego gracza: 3. Oceny typów innych graczy dla każdego gracza 4. Zbiór akcji dla każdego gracza: 5. Zbiór funkcji strategii dla każdego gracza zależnych od typu 6. Funkcja wypłat dla każdego gracza i każdego typu gracza gdzie Gry Bayesowskie • Niepełna informacja może dotyczyć czegokolwiek w grze: – Funkcji wypłat – Akcji innych graczy – Ocen innych (belief of others) • Harsanyi pokazał, że wprowadzenie typów przy funkcjach wypłat jest właściwym podejściem • Równowaga Bayesowska Nasha to profil strategii (jedna dla każdego typu każdego gracza) taka, że każdy typ stosuje najlepszą odpowiedź (best response) dysponując swoją oceną (belief) typów innych graczy i ich strategii Panika finansowa (Bank run) • Ty (gracz I) oraz inny inwestor (gracz II) macie depozyt w wysokości 100 złotych w banku. • Jeśli inwestor dobrze zarządza pieniędzmi oboje dostaniecie 150 złotych pod koniec roku. Jeśli nie, stracicie Wasze pieniądze. • Możesz spróbować wypłacić pieniądze teraz, ale bank ma tylko 100 złotych w gotówce. – Jeśli tylko jeden z Was spróbuje wypłacić dostanie 100 złotych. – Jeśli oboje będziecie starali się wypłacić, oboje dostaniecie po 50 złotych. • Wierzysz, że inwestor dobrze zarządza z prawdopodobieństwem q. • Gracz II wie czy szef banku dobrze zarządza czy źle. • Ty oraz gracz II musicie jednocześnie zdecydować, czy wypłacić pieniądze z banku, czy nie. Typy równowag Wypłacić Wypłacać Nie wypłacać 50, 50 0, 100 Nie wypłacać Wypłacić 100, 0 Wypłacać 150, 150 Nie wypłacać dobry q 50, 50 0, 100 Nie wypłacać 100, 0 0, 0 słaby (1-q) • Równowaga separowalna (separating eq.): każdy typ gra inną strategię • Równowaga łączona (pooling eq.): każdy typ gra tą samą strategię • Jak zachowałbyś się jako gracz II, gdybyś wiedział, że szef banku słabo zarządza? • Wypłaciłbyś pieniądze Wypłacić Wypłacać 50, 50 Nie wypłacać 0, 100 Nie wypłacać Wypłacić 100, 0 Wypłacać 150, 150 Nie wypłacać dobry q 50, 50 Nie wypłacać 100, 0 0, 100 0, 0 słaby (1-q) Równowagi separowalne: • (Dobry: Wypłacić, Zły: Nie wypłacać) • Nie może być równowagą, ponieważ Wypłacić jest dominującą strategią dla Słaby • (Dobry: Nie wypłacać, Słaby: Wypłacić): Oczekiwana wypłata gracza I: • Wypłacić: • Nie wypłacać: Dwie możliwości: • q<1/2: Gracz I wybierze Wypłacić, wtedy gracz II Dobrego typu powinien zagrać Wypłacić, co przeczy założeniu, że gra Nie wypłacać • q≥1/2: Gracz I wybierze Nie wypłacać. Najlepszą odpowiedzią gracza II Dobrego typu jest Nie wypłacać, co nie przeczy założeniu Równowaga separowalna: • dla q<1/2: nie ma • dla q≥1/2 Gracz I: Nie wypłacać, Gracz II: (Dobry: Nie wypłacać, Słaby: Wypłacać) Wypłacić Wypłacać Nie wypłacać 50, 50 0, 100 Nie wypłacać Wypłacić 100, 0 Wypłacać 150, 150 Nie wypłacać dobry q 50, 50 0, 100 Nie wypłacać 100, 0 0, 0 słaby (1-q) Równowagi łączone: • (Dobry: Nie wypłacać, Słaby: Nie wypłacać) – Nie może być równowagą, ponieważ Wypłacać jest dominującą strategią dla Słabego • (Dobry: Wypłacać, Słaby: Wypłacać) Oczekiwana wypłaty gracza I: • Wypłacać • Nie wypłacać Gracz I wybierze Wypłacać. Najlepsza odpowiedź dobrego typu gracza II jest Wypłacać. Zatem dla każdej wartości q następująca równowaga łączona jest jedyna: Rówowaga łączona Gracz I: Wypłacać, Gracz II: (Dobry: Wypłacać, Słaby: Wypłacać) Jeśli q<1/2 jedyną równowagą jest równowaga łączona panika finansowa