Wst*p do Teorii Gier

advertisement
Wstęp do Teorii Gier
Biologia
Prosty model konfliktu wg Maynarda Smitha i
Price'a.
• Dwa osobniki jednego gatunku spotykają się
w sposób losowy
• Każdy z nich chce pewne dobro, ale tylko
jeden je dostanie
• Zdobycie dobra warte jest 50 punktów
dostosowawczych
– na przykład zwiększenie
prawdopodobieństwa przekazania swoich
genów następnemu pokoleniu.
• Dwie strategie:
– Jastrząb - walczy o dobro
– Gołąb - ogranicza się do działań
symbolicznych
Gra gołąb-jastrząb
•
•
•
•
Zdobycie dobra +50
Przegrana w walce -100
Strata czasu ma straszenie się -10
Zatem:
– jastrząb walczący z jastrzębiem - 0.5*50+0.5*(-100)=25
– Jastrząb z gołębiem 50
– Gołąb z jastrzębiem 0
– Gołąb z gołębiem 0.5*(50-10)+0.5*(-10)=15
Strategia stabilna ewolucyjnie
• Jeśli są same gołębie, to opłacałoby się być jastrzębiem
• Jeśli są same jastrzębie, opłacałoby się być gołębiem
• Strategia 7/12 jastrząb 5/12 gołąb jest stabilna
ewolucyjnie
• Strategia jest stabilna ewolucyjnie, jeśli spełnia: Niech T
będzie jakąkolwiek inną strategią czystą lub mieszaną. Załóżmy, że wszystkie osobniki grają S
za wyjątkiem niewielkiej liczby tych, co grają T. Jeśli S jest SSE, to oczekiwana wypłata graczy
grających S jest nie mniejsza niż oczekiwana wypłata graczy grających T.
• Znaczy to tyle, że populacja S jest odporna na inwazję
mutantów T.
Strategia stabilna ewolucyjnie
P2
• B jest jedyną ESS
P1
A
B
P2
• A i B są ESS
P1
A
B
P2
• Tylko mieszana ESS
P1
A
B
A
B
1
3
2
4
A
B
3
2
1
4
A
B
1
2
4
3
Strategia stabilna ewolucyjnie
• Ogólnie dla gier 2x2:
– A jest ESS, jeśli a>c, lub a=c i b≥d
– B jest ESS, jeśli d>b, lub d=b i c≥a
– Inaczej tylko mieszana
P2
P1
A
B
A
B
a
c
b
d
• Jeśli jest więcej niż dwie strategie, to
– strategia czysta S jest stabilna ewolucyjnie, jeśli na głównej przekątnej
dla strategii S jest wartość najwyższa w tej kolumnie – ponieważ
wtedy S jest najlepszą strategią przeciwko sobie samej S.
– Jeśli wartość na przekątnej nie jest jedyną największą wartością w
kolumnie, potrzebny jest dalszy test: Wtedy S musi być niegorsza
przeciwko jakiejkolwiek alternatywie niż ta alternatywa jest dla siebie
samej
Znęcający się nad słabszymi
•
Jeśli jest więcej niż dwie strategie, czysta strategia S jest SSE, jeśli wartość
wypłaty dla S leżąca na głównej przekątnej macierzy gry jest największą
wartością w swojej kolumnie
• Dodajmy strategię „gnębiciel” – atakuj jeśli przeciwnik
się nie broni, uciekaj kiedy atakuje (jeśli dwóch gnębicieli
się spotka, jeden z nich ucieknie szybciej niż pozostały)
• Gołąb jest zdominowany
• Jedyna SSE to ½ jastrzębia, ½ gnębiciela
• Jak najlepiej radzić sobie z gnębicielem?
Mściwy typ
• Dodajmy strategię „mściciel” – na początku graj gołębia, ale
jeśli cię ktoś atakuje walcz z nim z całej siły
• Mściciel jest SSE
• Również SSE jest strategia mieszana - mniej niż 30% gołębia,
reszta mściciel (jeśli będzie więcej niż 30% gołębi, gnębiciel
dokona inwazji)
• W populacji mścicieli nie dochodzi do walki – ten rodzaj
pokojowej równowagi zachodzi dzięki gotowości do walki
Mściwy typ
• Are we jumping to conclusions too soon???
– We should check ALL conditional strategies in fact.
• However, the retaliator strategy is very robust.
– To do better against a retaliator than another retaliator would do, you
would have to win the resource from him without wasting time or risking
injury. This is difficult because a retaliator will not run away, and if you
fight him, he will fight back.
Another conclusion??
– Conditional strategies seem to do better than mechanical strategies
Efektywność i koordynacja
7
5
1 7
5
(25)  (50)  6  (0)  (15)
12
12
4 12
12
•
•
•
•
Wynik nieoptymalny w sensie Pareto
Gdyby grali gołębia, mieliby po 15
A gdyby grali ½ GJ, ½ GJ to mieliby po 25
Jak skoordynować działanie:
–
–
–
–
Walcz tylko wtedy, gdy jesteś większy
Walcz tylko wtedy, gdy masz dłuższy ogon
Walcz tylko wtedy, gdy jaśniejsze pierze
Walcz tylko wtedy, gdy jesteś na swoim
terytorium
50
Symetryczny wynik paretooptymalny
25
GG
-25
SSE
25
-25
50
Mieszczuch
• Rozpatrzmy strategię „posiadacza” – bądź jastrzębiem na
własnym terytorium, a gołębiem na cudzym
• Załóżmy, że połowa starć na własnym terytorium oraz że dwa
osobniki nigdy nie spotkają się na terytorium nienależącym do
któregoś z nich
• Dwie SSE
– Mściciel dopuszczający istnienie pewnej liczby gołębi
– Posiadacz dopuszczający istnienie pewnej liczby gnębicieli
Exercise [Dawkins (1976)]
•
•
•
•
•
a)
b)
c)
d)
e)
A bird female tries to get a male to stay around and help raise a family of babies,
instead of going off and propagating his genes elsewhere.
One possible technique is to insist on a long and arduous courtship before mating.
Suppose a female can be either coy (insist on courtship) or fast (be willing to mate
with anyone)
A a male can be either faithful (go through a courtship and then help raise the babies)
or philandering (be unwilling to go through a courtship, and desert any female after
mating)
Suppose the payoff to each parent of babies is +15, the total cost of raising babies is 20, which can be split equally between both parents, or fall entirely on the female if
the male deserts. Suppose the cost of a long courtship is -3 to each player.
Formulate the resulting game
Draw the movement diagram of this game to show
there is no pure strategy equilibrium
A mixed strategy ESS for males would be one which
equilizes the expected payoffs to coy and fast
females. Find it.
Similarly, find an ESS for the females.
If males and females follow these ESS’s, what will the
epxected payoffs be? Is this result Pareto optimal?
Gry Bayesowskie
• Gry z niepełną informacją (incomplete information), gdzie
gracze poruszają się jednocześnie
• Co jest nowego z grze Bayesowskiej:
– Każdy gracz ma jakiś typ (type), który podsumowuje jego prywatną
informację
– Każdy gracz dokonuje oceny (belief) typów innych graczy
– Wypłaty graczy zależą od typów
– Różne typy tego samego gracza mogą grać różne strategie
Gry w postaci strategicznej
Gra z pełną informacją
Gra z niepełną informacją
1.
2.
Zbiór graczy:
Zbiór akcji dla każdego gracza:
1.
2.
Zbiór graczy:
Zbiór typów dla każdego gracza:
3.
Funkcja wypłat dla każdego
gracza:
3.
Oceny typów innych graczy dla
każdego gracza
4.
Zbiór akcji dla każdego gracza:
5.
Zbiór funkcji strategii dla każdego
gracza zależnych od typu
6.
Funkcja wypłat dla każdego gracza i
każdego typu gracza
gdzie
Gry Bayesowskie
• Niepełna informacja może dotyczyć czegokolwiek w grze:
– Funkcji wypłat
– Akcji innych graczy
– Ocen innych (belief of others)
• Harsanyi pokazał, że wprowadzenie typów przy funkcjach
wypłat jest właściwym podejściem
• Równowaga Bayesowska Nasha to profil strategii (jedna dla
każdego typu każdego gracza) taka, że każdy typ stosuje
najlepszą odpowiedź (best response) dysponując swoją oceną
(belief) typów innych graczy i ich strategii
Panika finansowa (Bank run)
• Ty (gracz I) oraz inny inwestor (gracz II)
macie depozyt w wysokości 100 złotych w
banku.
• Jeśli inwestor dobrze zarządza pieniędzmi
oboje dostaniecie 150 złotych pod koniec
roku. Jeśli nie, stracicie Wasze pieniądze.
• Możesz spróbować wypłacić pieniądze teraz,
ale bank ma tylko 100 złotych w gotówce.
– Jeśli tylko jeden z Was spróbuje wypłacić dostanie
100 złotych.
– Jeśli oboje będziecie starali się wypłacić, oboje
dostaniecie po 50 złotych.
• Wierzysz, że inwestor dobrze zarządza z
prawdopodobieństwem q.
• Gracz II wie czy szef banku dobrze zarządza
czy źle.
• Ty oraz gracz II musicie jednocześnie
zdecydować, czy wypłacić pieniądze z banku,
czy nie.
Typy równowag
Wypłacić
Wypłacać
Nie wypłacać
50, 50
0, 100
Nie wypłacać
Wypłacić
100, 0
Wypłacać
150, 150
Nie wypłacać
dobry q
50, 50
0, 100
Nie wypłacać
100, 0
0, 0
słaby (1-q)
• Równowaga separowalna (separating eq.): każdy typ gra inną strategię
• Równowaga łączona (pooling eq.): każdy typ gra tą samą strategię
• Jak zachowałbyś się jako gracz II, gdybyś wiedział, że szef banku słabo
zarządza?
•
Wypłaciłbyś pieniądze
Wypłacić
Wypłacać
50, 50
Nie wypłacać
0, 100
Nie wypłacać
Wypłacić
100, 0
Wypłacać
150, 150
Nie wypłacać
dobry q
50, 50
Nie wypłacać
100, 0
0, 100
0, 0
słaby (1-q)
Równowagi separowalne:
• (Dobry: Wypłacić, Zły: Nie wypłacać)
•
Nie może być równowagą, ponieważ Wypłacić jest dominującą strategią dla Słaby
• (Dobry: Nie wypłacać, Słaby: Wypłacić):
Oczekiwana wypłata gracza I:
• Wypłacić:
• Nie wypłacać:
Dwie możliwości:
•
q<1/2: Gracz I wybierze Wypłacić, wtedy gracz II Dobrego typu powinien
zagrać Wypłacić, co przeczy założeniu, że gra Nie wypłacać
• q≥1/2: Gracz I wybierze Nie wypłacać. Najlepszą odpowiedzią gracza II
Dobrego typu jest Nie wypłacać, co nie przeczy założeniu
Równowaga separowalna:
• dla q<1/2: nie ma
• dla q≥1/2 Gracz I: Nie wypłacać, Gracz II: (Dobry: Nie wypłacać, Słaby:
Wypłacać)
Wypłacić
Wypłacać
Nie wypłacać
50, 50
0, 100
Nie wypłacać
Wypłacić
100, 0
Wypłacać
150, 150
Nie wypłacać
dobry q
50, 50
0, 100
Nie wypłacać
100, 0
0, 0
słaby (1-q)
Równowagi łączone:
• (Dobry: Nie wypłacać, Słaby: Nie wypłacać)
– Nie może być równowagą, ponieważ Wypłacać jest dominującą strategią dla Słabego
• (Dobry: Wypłacać, Słaby: Wypłacać)
Oczekiwana wypłaty gracza I:
• Wypłacać
• Nie wypłacać
Gracz I wybierze Wypłacać. Najlepsza odpowiedź dobrego typu gracza II
jest Wypłacać. Zatem dla każdej wartości q następująca równowaga
łączona jest jedyna:
Rówowaga łączona
Gracz I: Wypłacać, Gracz II: (Dobry: Wypłacać, Słaby: Wypłacać)
Jeśli q<1/2 jedyną równowagą jest równowaga łączona panika finansowa
Download