TEORIA GIER - semestr zimowy 2011

advertisement
TEORIA GIER - semestr zimowy 2011
Przykładowe rozwiązania
4. Gracz I, mąż, wychodzi pod wieczór z domu mówiąc, że idzie jeszcze popracować.
W rzeczywistości dopiero zdecyduje, czy naprawdę pójdzie do pracy, czy spotka się
z inną kobietą. Gracz II, żona, domyśla się tego i musi zdecydować, czy wysłać w
ślad za mężem detektywa. Jeśli tego nie zrobi, nie dowie się niczego nowego i jej użyteczność wyniesie 0. Jeśli detektyw wyśledzi męża na spotkaniu z inną, użyteczność
męża wyniesie −10, a żony 8. Jeśli mąż spotka się z inną, a żona nie dowie się o tym,
użyteczność męża wyniesie 5. Użyteczność męża z pójścia do pracy wynosi p, przy
czym 0 < p < 5. Za wynajęcie detektywa trzeba zapłacić c jednostek użyteczności.
Detektyw jest lojalny wobec zleceniodawcy i na tyle sprawny, że mąż go nie ”zgubi”.
(a) Podać postać ekstensywną i normalną dwóch wersji tej gry: pierwszej z niepełną
informacją i drugiej z pełną (w której mąż jest w stanie stwierdzić, czy detektyw go
śledzi).
(b) Przyjmując p = c = 2 wyznaczyć równowagi obu gier i podać wypłaty obu
graczy w tych równowagach.
(c) Jak droga musiałaby być praca detektywa, by gra z niepełną informacją miała
równowagę w czystych strategiach?
5. Dwie firmy A i B konkurujące na pewnym rynku podejmują jednocześnie i niezależnie od siebie decyzję, czy rozpocząć kampanię negatywnej reklamy skierowanej
przeciw konkurentowi. Obecnie każda z firm osiąga ze sprzedaży na tym rynku 10
i tak też pozostanie, jeżeli nikt nie zdecyduje się na rozpoczęcie kampanii. Prowadzenie kampanii kosztuje 15. Jeśli obie firmy prowadzą kampanię, podział rynku i
dochody ze sprzedaży nie zmieniają się. Jeśli kampanię prowadzi tylko jedna firma,
to jej konkurent zostaje wyeliminowany z rynku, a dochód ze sprzedaży produktu
firmy, która pozostaje na rynku, wzrasta o 20 w przypadku firmy A i o r > 20 w
przypadku firmy B .
(a) Podać postać normalną i ekstensywną tej gry i wyznaczyć wszystkie jej równowagi Nasha.
(b) Oznaczmy przez p(r) prawdopodobieństwo wyeliminowania z rynku firmy A w
równowadze w strategiach mieszanych. Czy p jest rosnącą, czy malejącą funkcją
zmiennej r?
(c) Podać postać normalną i ekstensywną wersji tej gry z pełną informacją, w której
firma A podejmuje decyzję jako pierwsza, a B decyduje znając już wybór konkurenta.
(d) Czy w grze z pełną informacją korzystniej dla gracza jest decydować jako pierwszy, czy jako drugi? Uzasadnić odpowiedź.
Rozwiązanie – 4
(a) W obu wersjach gry żona ma dwie strategie: wynająć detektywa (D) lub nie (ND).
Mąż w wersji z niepełną informacją też ma 2 strategie: pójść do pracy (Pr) lub do
innej (In), a w wersji z pełną informacją 4: Pr, In i dwie strategie ”warunkowe”:
(D → Pr, ND → In) oraz (D → In, ND → Pr).
Pr
In
−c ; p 8 − c ; 10
Postać normalna przy niepełnej informacji: Ż D
ND
0;p
0;5
przy pełnej :
Ż D
ND
Pr
−c; p
0;p
In
D → Pr, ND → In
8 − c ; −10
−c ; 5
0;5
0;5
D → In, ND → Pr
8 − c ; −10
0;p
Postać ekstensywna: Ż jako pierwsza wybiera między D a ND, następnie M wybiera
między Pr a In. W wersji z niepełną informacją oba jego wierzchołki decyzyjne są
w jednym zbiorze informacyjnym.
Oczywiście, jak w każdym takim zadaniu, trzeba porządnie narysować drzewo, podać
wypłaty, etykiety wierzchołków i łuków i zaznaczyć ew. zbiory informacyjne.
(b) Z postaci normalnej gry z niepełną informacją widać od razu, że jeżeli c < 8,
to żadna para czystych strategii nie jest równowagą (co od razu jest odpowiedzią
na (c)). Jeśli c ­ 8, to ND jest dominującą strategią żony i jest w równowadze z
najlepszą odpowiedzią męża na ND, czyli strategią In.
Równowaga w strategiach mieszanych przy c < 8: Ż wynajmuje detektywa z prawdopodobieństwem xD , M idzie do innej z prawdopodobieństwem yIn
gdzie yIn jest tą wielkością, przy której Ż jest indyferentna między wyborem D a
ND – rozwiązaniem równania 8yIn − c = 0 ; yIn = 8c , yP r = 1 − 8c ;
xD jest tą wielkością, przy której M jest indyferentny między wyborem Pr a In –
rozwiązaniem równania −10xD + 5(1 − xD ) = p ; xD = 5−p
, xN D = p+10
;
15
15
1
4
dla p = 2 mamy xD = 5 , xN D = 5 .
Wypłaty w tej równowadze: Ż 0 , M p (można darować sobie ich obliczanie, bo
wiadomo, że muszą być równe (jednakowym) wypłatom każdej ze strategii czystych
przeciw tym mieszanym strategiom równowagi).
W grze z pełną informacją indukcja wstecz wyznacza jedyną równowagę doskonałą:
(ND , (D → In, ND → Pr)) – strategia męża w tej równowadze słabo dominuje
każdą inną. Przy c < 8 nie ma innych równowag z tego samego powodu co w grze z
niepełną informacją.
Rozwiązanie – 5
(a) Postać normalna:
A RN
Nie
RN
Nie
–5 ; –5
15 ; 0
0 ; r − 5 10 ; 10
(RN – reklama negatywna).
Równowagi :
(1) A prowadzi kampanię, B nie prowadzi z wypłatami A 15 , B 0
(2) A nie prowadzi kampanii , B prowadzi z wypłatami A 0 , B r − 5
(3) w strategiach mieszanych: A : prowadzi kampanię z prawdopodobieństwem a,
B prowadzi kampanię z prawdopodobieństwem b
gdzie a jest tą wielkością, przy której B jest indyferentny między prowadzeniem
kampanii a nie – rozwiązaniem równania −5a + (r − 5)(1 − a) = 0a + 10(1 − a) ;
r−15
a = r−10
;
b jest tą wielkością, przy której A jest indyferentny między prowadzeniem kampanii
a nie – rozwiązaniem równania −5b + 15(1 − b) = 0b + 10(1 − b) ; b = 12 ;
50
wypłaty w tej równowadze: A 5 , B r−10
(najłatwiej je wyliczyć biorąc wypłaty
strategii czystych przeciw mieszanej str. równowagi)
Postać ekstensywna – kolejno A i B wybierają akcje RN bądź Nie, drugi wybierający
gracz ma niepełną informację – oba jego wierzchołki decyzyjne są w jednym zbiorze
informacyjnym.
(b) p(r) jest prawdopodobieństwem,
że B poprowadzi kampanię informacyjną, a A
1
r−15
5
nie, a zatem p(r) = 2 · 1 − r−10 = 2(r−10)
– maleje przy rosnącym r.
(c) Gracz B ma teraz 4 strategie, a postać ekstensywna różni się od tej z (a) tym,
że usunięto 2elementowy zbiór informacyjny.
RN
Nie
To samo co A Inaczej niż A
–5 ; –5
15 ; 0
-5 ; -5
15 ; 0
Postać normalna: A RN
Nie 0 ; r − 5 10 ; 10
10 ; 10
0 ; r−5
(Strategia ”to samo co A” gracza B jest zdominowana, a ”inaczej niż A” słabo
dominująca. W jedynej równowadze doskonałej A gra RN, a B gra ”inaczej niż
A”).
(d) W jedynej równowadze doskonałej gry z pełną informacją gracz wybierający
jako pierwszy ma wyższą wypłatę niż wybierający jako drugi.
16. Gracz 1, napastnik, strzela karnego graczowi 2, bramkarzowi, i ma do wyboru
2 strategie: strzelać w lewy róg (bramki, widziany od strony boiska) lub w prawy.
Bramkarz ma do wyboru 3 strategie: rzucić się w lewy róg (jak wyżej), rzucić się w
prawy róg lub zaczekać na to, gdzie strzeli gracz 1. Napastnik na pewno trafi tam
gdzie chce i wobec tego na pewno strzeli bramkę, gdy bramkarz rzuci się w przeciwny
róg. Jeśli bramkarz od razu rzuci się w ten róg, w który strzela napastnik, obroni
karnego z prawdopodobieństwem 0,4 przy strzale w lewy róg, a z prawdopodobieństwem 0,3 przy strzale w prawy róg. Jeżeli zaczeka, obroni strzał w każdy z rogów z
prawdopodobieństwem o 0,1 mniejszym, niż gdyby od razu rzucił się w dany róg.
(a) Podać macierz otrzymanej w tej sytuacji gry o sumie zerowej, w którą wypłatą
gracza 1 jest prawdopodobieństwo strzelenia bramki.
(b) Wyznaczyć wartość tej gry i strategie optymalne obu graczy.
(c) Czy i ewentualnie jak zmieni się odpowiedź na pytanie (b), gdy gracz 1 ma
dodatkowo trzecią strategię strzelania w środek bramki? (Bramkarz na pewno obroni
taki strzał, gdy zaczeka, a na pewno nie obroni, gdy rzuci się w któryś z rogów).
Uzasadnić odpowiedź.
Roziwązanie
(a) Przy ponumerowaniu strategii:
gracza 1 : 1. L (strzela w lewy), 2. P (strzela w prawy)
gracza 2 : 1. L (rzuca się w lewy), 2. P (rzuca się w prawy) 3. Cz (czeka)
"
#
0, 6 1 0, 7
macierzą wypłat gracza 1 jest
.
1 0, 7 0, 8
(b) Gra oczywiście nie ma równowagi w strategiach czystych, a ponieważ jeden z
graczy ma więcej niż 2 strategie, najprostszy algorytm szukania równowag dla gier
2 × 2 nie zadziała. Znajdziemy strategię optymalną gracza 1 – wiemy z teorii, że w
grach o sumie zerowej (bądź stałej) jest to strategia równowagi. a więc maksymalizująca (w takich grach) wypłatę gracza 1 przeciw najlepszej odpowiedzi gracza 2.
Gracz 1 rozwiązuje więc (przy oznaczeniu x = xL , 1 − x = xP ) problem
max min(u1 ((x, 1 − x), L), u1 ((x, 1 − x), P), u1 ((x, 1 − x), Cz)) =
x∈[0,1]
max min(1 − 0, 4x , 0, 7 + 0, 3x , 0, 8 − 0, 1x)
.
x∈[0,1]
Można wyliczyć (a prościej: narysować) te obszary x, w których minimum w nawiasie
jest realizowane przez pierwszą, drugą lub trzecią funkcję – czyli strategie bramkarza.
Rozwiązaniem jest x = 0, 25 ; wówczas
"
u1 (x, P) = u1 (x, Cz) = [0, 25 0, 75] ·
"
u1 (x, L) = [0, 25 0, 75] ·
1
0, 7
#
0, 6
1
#
"
= [0, 25 0, 75] ·
0, 7
0, 8
#
= 0, 775 ,
= 0, 9 .
Optymalną strategią napastnika (x) jest więc strzał w lewy róg z prawdopodobieństwem 0,25, a w prawy z prawd. 0,75. Wartość gry wynosi 0,775.
Ponieważ najlepszymi odpowiedziami bramkarza na x są P i Cz, a L nie jest, strategia optymalna bramkarza jest tą strategią mieszaną używającą wyłącznie P i Cz ,
przy której napastnik jest indyferentny między strzałem w lewy a prawy róg bramki.
Rozwiązaniem jest y L = 0 , y P = 0, 25 , y Cz = 0, 75. (Lub równoważnie: najbezpieczniejsza strategia bramkarza, przy czym wystarczy szukać wśród tych z yL = 0).,
(c) Przeciw ”starej” strategii optymalnej bramkarza, y , ta dodatkowa strategia daje
napastnikowi oczekiwaną wypłatę 0,25, a więc nie obniża poziomu bezpieczeństwa
bramkarza. Strategia optymalna bramkarza pozostaje bez zmian, a wobec tego strategia optymalna napastnika (jego najlepsza odpowiedź na y) i wartość gry też się
nie zmienią.
12. W trzyosobowej grze ”konformiści” gracze równocześnie podnoszą rękę. Jeśli
wszyscy podniosą lewą lub wszyscy prawą, każdy otrzymuje wypłatę 0. Jeśli jeden
z graczy podniesie inną rękę niż dwaj pozostali – np. jako jedyny podniesie lewą –
to płaci po 1 zł obu pozostałym graczom.
(a) Podać poziomy bezpieczeństwa wszystkich strategii czystych i mieszanych gracza 1. Jaka strategia jest najbezpieczniejsza? Czy układ, w którym wszyscy gracze
używają swoich najbezpieczniejszych strategii, jest równowagą Nasha?
(b) Znaleźć równowagę Nasha, w której gracze nie grają swoich najbezpieczniejszych
strategii.
Roziwązanie
(a) Każdy z graczy ma dwie strategie czyste, L i P. Poziom bezpieczeństwa strategii
to jej wypłata w najgorszym możliwym przypadku – czyli wtedy, gdy obaj pozostali
gracze zagrają drugą strategię czystą, czyli −2.
Formalnie, poziom bezpieczeństwa dowolnej strategii x = (xL , xP ) gracza np. 1
(czystej lub mieszanej) to
β(x) = min(u1 (x, L, L), u1 (x, L, P ), u1 (x, P, L), u1 (x, P, P ))
czyli min(u1 (x, L, L), u1 (x, P, P )), bo u1 (x, L, P ), u1 (x, P, L) = 1 – gdy dwaj gracze
grają różne strategie czyste, trzeci zawsze wygrywa. Zaś
u1 (x, L, L) = 0xL − 2xP
,
u1 (x, P, P ) = −2xL + 0xP ,
a więc najbezpieczniejsza jest strategia maksymalizująca min(−2xL , −2xP ) –
xL = xP = 0, 5.
(b) Wszyscy grają tę samą strategię czystą.
12. Trzy siostry dzielą między siebie trzy odziedziczone obiekty: mieszkanie, jacht i
cenny obraz. Uzgodniono następującą procedurę podziału: najmłodsza siostra oznajmia, z którego obiektu rezygnuje, najstarsza zgodnie z tym przydziela jej jeden z
dwóch innych obiektów, a na koniec spośród dwóch, których nie dostała najmłodsza,
jeden wybiera dla siebie średnia siostra. Ostatni z obiektów zostaje dla najstarszej
siostry. Każda z sióstr kieruje się tylko swą preferencją co do przypadającego jej
dobra, nie interesując się tym, której przypadły inne obiekty.
(a) Podać postać ekstensywną gry, w której wszystkie siostry najbardziej chciałyby
dostać mieszkanie, ale najstarsza woli dostać jacht niż obraz, a obie pozostałe odwrotnie. (Można przyjąć dla każdego gracza wypłatę 2 za najbardziej preferowany
obiekt, 1 za średni i 0 za najmniej preferowany). Znaleźć w tej grze dwie równowagi
doskonałe, w których najmłodsza siostra rezygnuje z różnych obiektów. Która z tych
dwóch jej strategii wydaje się Pani / Panu rozsądniejsza i dlaczego?
(b) Pokazać, że gdy każda z sióstr najwyżej ceni sobie inny obiekt, to w równowadze doskonałej każda dostanie najbardziej preferowany. Opisać dokładnie strategie
wszystkich trzech w tej równowadze.
Roziwązanie
(a)
Opis drzewa: Zaczyna najmnłodsza siostra (Mł), wybiera jedną z 3 akcji: RM (rezygnuje z mieszkania), RJ i RO. Następnie najstarsza (St) wybiera jedną z 2 możliwych
akcji: po RM są to J → Mł (przydziela młodszej jacht) i O → Mł , po RJ M →
Mł i O → Mł, a po RO są to J → Mł i M → Mł. Następnie średnia (Śr) wybiera
dla siebie jeden z 2 dostępnych obiektów – np. po akcjach RM i O → Mł wybiera
pomiędzy J a M. Na końcu tej ścieżki Mł dostaje obraz, Śr mieszkanie, a St jacht.
Gra jest z pełną informacją.
Oczywiście trzeba narysować całe drzewo, poetykietować wszystkie łuki i wypisać
wypłaty (lub lepiej podział obiektów) w każdym wierzchołku końcowym. Trzeba
także zaznaczyć akcje wybierane w trakcie indukcji wstecz.
Analiza przy preferencjach z p. (a) :
Śr zawsze wybierze mieszkanie jeśli jest dostępne, a jeśli nie – tj. jeśli St zagrała M
→ Mł – to obraz. Wiedząc to, St nigdy nie zagra J → Mł, bo wtedy po optymalnej
reakcji Śr sama zostanie z obrazem. Jeśli natomiast Mł sama zrezygnuje z jachtu,
RJ, to St będzie indyferentna między przydzieleniem jej mieszkania bądź obrazu,
bo w obu przypadkach zostanie jej jacht. Mł spodziewa się zatem M jeśli zagra RO,
O jeśli zagra RM, a jeśli zagra RJ, to M lub O w zależności od tego, co wtedy
zdecyduje St. Jeśli spodziewa się, że St po RJ wynierze M → Mł , może zagrać RJ;
jeśli spodziewa się O → Mł , powinna zagrać RO.
Są więc 3 równowagi doskonałe w czystych strategiach:
(1) Mł : RO , Śr : zawsze wybiera lepszy obiekt, St: nigdy nie J → Mł a po RJ – O
→ Mł ;
(2) Mł : RO , Śr : zawsze wybiera lepszy obiekt, St: nigdy nie J → Mł a po RJ – M
→ Mł ;
(3) Mł : RJ , Śr : zawsze wybiera lepszy obiekt, St: nigdy nie J → Mł a po RJ – M
→ Mł
i w każdej z nich wynik (podział obiektów) jest taki sam.
Wszystko to widać na drzewie gry w procesie indukcji wstecz.
Dla Mł bezpieczniej jest zrezygnować z obrazu, bo wtedy w jedynej równowadze
doskonałej podgry następującej po jej decyzji dostaje mieszkanie. Po RJ ryzykuje że
spośród równowag doskonałych podgry może zostać rozegrana ta, w której dostanie
obraz.
(b) Załóżmy że najmłodsza siostra preferuje obraz, średnia mieszkanie, a najstarsza
jacht. Wtedy:
jeżeli Mł nie zagra RO, St zagra O → Mł bo wtedy gwarantuje sobie J (Śr wybierze
mieszkanie). Zatem w każdej równowadze doskonałej St zagra O → Mł jeśli
tylko może;
jeżeli Mł zagra RO – HGW, ale w takim wypadku Mł nie dostanie obrazu który dostałaby rezygnując z czegokolwiek innego, Czyli RO nie jest najlepszą
odpowiedzią Mł na jakiekolwiek strategie równowagi dosk.
– a zatem nie trzeba dokładnie badać strategii równowagi w podgrze po RO. W
każdej równowadze doskonałej Mł gra RM lub RJ, a St przydziela jej obraz i sama
dostaje jacht.
13. Dwaj gracze targują się o podział sumy 19,99 zł. Pierwszą propozycję podziału
składa gracz I. Jeśli gracz II ją odrzuci, to z sumy 19,99 ubywa 6 zł i gracz II
składa propozycję podziału mniejszej sumy; jeśli ta z kolei zostanie odrzucona przez
gracza I, to gra się kończy i obaj gracze dostają po 5,50 zł, a resztę zabiera arbiter.
Przyjęcie którejkolwiek propozycji także kończy grę i wtedy następuje uzgodniony
podział. Zakładamy, że legalne są tylko takie propozycje podziału, w których oferent
otrzymuje całkowitą liczbę złotówek (czyli np. pierwsza propozycja gracza I musi
być postaci: n zł 99 gr dla ciebie, 19 − n zł dla mnie). Gracze nie dyskontują wypłat.
Narysować fragment drzewa tej gry z co najmniej jedną gałęzią każdej możliwej
długości. Znaleźć jej równowagę doskonałą i podać pełny opis tworzących ją strategii
oraz otrzymany podział.
Roziwązanie
Opis drzewa: Zaczyna gracz I, wybiera jedną z 20 propozycji: (0 , 19,99) , ... , (19,
0,99). Każdą z nich II może zaakceptować albo odrzucić. Gdy zaakceptuje (k ,
19 − k zł 99 gr), gra kończy się z tymi wypłatami, Gdy odrzuci, składa jedną z 14
kontrpropozycji: (0,99 , 13) , ... , (13,99 , 0). Jeśli I ją przyjmie, gra kończy się z
tymi wypłatami; jeśli odrzuci, gra kończy się z wypłatami (5,50 , 5,50). Informacja
jest pełna – nie ma nietrywialnych zbiorów informacyjnych.
Oczywiście reprezentatywny fragment drzewa trzeba narysować, najlepiej istotny dla
znajdowania równowagi. Trzeba też zaznaczyć akcje wybierane w trakcie indukcji
wstecz.
Analiza: Pierwszy etap indukcji wstecz: Jeśli gracz I odrzuci kontrprppozycję gracza
II, otrzyma 5,50, a zatem odrzuci (0,99 , 13) , ... , (4,99 , 9) , a przyjmie (5,99 , 8) ,
... , (13,99 , 0).
Wiedząc to, II spodziewa się, że po odrzuceniu pierwszej propozycji gracza I otrzyma
8 – najwyższą z wypłat po optymalnej reakcji I. Wobec tego pójdzie na tę możliwość
– tj. odrzuci propozycję I i sam zaproponuje (5,99 , 8) – jeśli I zaoferuje mu mniej
niż 8. Tzn. odrzuci (19 , 0,99) , ... , (12 , 7,99) , a przyjmie (11, 8,99) , (0 , 19,99).
Wiedząc to, I spodziewa się, że po odrzuceniu swej pierwszej propozycji otrzyma
5,99. Złoży więc najlepszą dla siebie ofertę spośród tych, które będą przyjęte i zarazam dadzą mu co najmniej 6. Jest nią oczywiście (11 , 8,99) .
Równowaga doskonała: Gracz I proponuje (11 , 8,99), zgadza się na propozycje II
dające mu co najmniej 5,99 i odrzuca pozostałe.
Gracz II przyjmuje propozycje I wtedy i tylko wtedy, gdy proponuje mu się co
najmniej 8,99, a po ew. odrzuceniu proponuje podział (5,99 , 8).
Wypłaty w tej rówonowadze: : 11 zł dla I , 8,99 zł dla II.
Przykład równowagi niedoskonałej: Każdy z graczy składa tylko propozycje (1,99
dla ciebie, reszta dla mnie), a przyjmuje tylko takie, w których oferuje mu się co
najmniej 9,99 zł.
Download