teoria gier w ekonomii - Wydział Matematyki i Informatyki UŁ

advertisement
TEORIA GIER
W EKONOMII
WYKŁAD 5: GRY DWUOSOBOWE
KOOPERACYJNE O SUMIE NIESTAŁEJ
dr Robert Kowalczyk
Katedra Analizy Nieliniowej
Wydział Matematyki i Informatyki UŁ
Gry dwumacierzowe
Skończoną grę dwuosobową o sumie dowolnej
można wyrazić jako parę macierzy [ai,j] oraz [bi,j] o
wymiarach mxn lub równoważnie jako macierz
(A,B) o wymiarach mxn, której elementami są
uporządkowane pary (ai,j,bi,j). Elementy ai,j oraz
ai,j,bi,j oznaczają, odpowiednio wypłaty (w
jednostkach użyteczności ) graczy I oraz II, przy
założeniu, że stosują oni, odpowiednio, i-tą i j-tą
strategię czystą. Gra w tej postaci nazywa się też
grą dwumacierzową.
Rozróżniamy
dwa
dwumacierzowych:
przypadki

niekooperacyjne (bez współpracy),

kooperacyjne (ze współpracą).
gier
(a1,1,b1,1)
(a1,2,b1,2)
(a1,3,b1,3)
(a2,1,b2,1)
(a2,2,b2,2)
(a2,3,b2,3)
Strategie mieszane i punkty równowagi
Przez strategie mieszane graczy I i II rozumiemy, odpowiednio, m-wymiarowe i nwymiarowe wektory x=(x1, x2,…,xm) i y =(y1, y2,…,yn) nieujemnych liczb, których
suma wynosi 1.
Powiemy, że para strategii mieszanych (x*,y*) gry dwumacierzowej (A,B) jest w
równowadze, jeśli dla wszystkich innych strategii mieszanych x i y zachodzą
nierówności:
xAy*t ≤x*Ay*t
oraz
x*Byt ≤x*By*.
Twierdzenie (Nash)
Każda gra dwumacierzowa o sumie niestałej ma co najmniej jedną parę strategii w
równowadze.
Czy para strategii w równowadze to rozwiązanie gry?
A
B
A
(3,3)
(0,4)
B
(4,0)
(1,1)
Para strategii (B,B) jest w
równowadze. Wypłata (1,1)
odpowiadająca tej strategii nie
jest wypłatą optymalną. Lepiej
było wybrać parę strategii
(A,A) i wypłatę (3,3).
A
B
A
(4,1)
(0,0)
B
(0,0)
(1,4)
Pary strategii (A,A) oraz
(B,B) są w równowadze
jednak nie są one wymienne
ani nie dają tych samych
wypłat. Gracze nie potrafią
zdecydować którą ze strategii
wybrać.
A
B
A
(2,2)
(2,2)
B
(2,2)
(2,2)
Pary strategii (A,A), (A,B),
(B,A)
i
(B,B)
są
w
równowadze. Są wymienne i
dają te same wypłaty. Każda
z nich jest rozwiązaniem gry.
Kryterium Pareto
Powiemy, że wynik gry (wypłata) jest
optymalny
w
sensie
Pareto
(paretooptymalny) jeżeli nie ma w grze
innego wyniku (wypłaty), który byłby dla
jednego gracza wyższy, a dla drugiego nie
niższy.
B
A
(3,3)
(0,4)
B
(4,0)
(1,1)
Punkty
paretooptymalne
AB
Aby stwierdzić, że dany punkt jest
paretooptymalny, wystarczy sprawdzić czy
punkt ten leży na północno-wschodnim
boku wielokąta rozpiętego na wszystkich
punktach (wartościach) gry dwuosobowej.
A
BB
AA
BA
Kryterium Pareto
Najczęściej przyjmujemy, że gra dwuosobowa o sumie niezerowej jest
rozwiązywalna (w ścisłym sensie), gdy:

ma co najmniej jedną równowagę Nasha,

wypłata odpowiadająca tej równowadze jest optymalna w sensie Pareto,

równowagi są wymienne i prowadzą do wypłat o tej samej wartości.
Rozwiązaniem gry (o ile istnieje) można nazwać każdą z równowag (strategii
mieszanych (x*,y*)) spełniających powyższe warunki.
Punkty równowagi a strategie dominujące
A
B
A
(2,3)
(3,2)
B
(1,0)
(0,1)
Jeżeli gracz I zagra strategię A (dominuje ona strategię B gdyż 2>1 oraz 3>0), to
gracz II powinien wybrać strategię A, żeby wygrać więcej 3>2. Rozwiązaniem jest
zatem para strategii (A,A), które jak łatwo zauważyć są w równowadze.
Oczywiście w tym przypadku wypłata odpowiadająca tej parze strategii jest
optymalna w sensie Pareto.
Gry bez równowagi w strategiach czystych (strategie
wyrównujące)
A
B
A
(2,4)
(1,0)
B
(3,1)
(0,4)
W tej grze nie ma równowagi (w strategiach czystych). Brak również strategii dominujących.
Szukamy najpierw strategii (x1,x2) dla gracza I (tzw. strategii wyrównującej). tzn. gracz I patrzy
na grę gracza II i wybiera tak wektor (x1,x2) aby gracz II niezależnie od tego czy zagra A czy B
to osiągnął ten sam zysk.
Dostajemy zatem układ równań:
4x1+x2= 0x1+4x2
x1+x2= 1.
Gra gracza I
A
B
Szukamy teraz strategii (y1,y2) dla gracza II (tzw. strategii wyrównującej). tzn. gracz II patrzy
na grę gracza I i wybiera tak wektor (y1,y2) aby gracz II niezależnie od tego czy zagra A czy B
to osiągnął ten sam zysk.
A
2
1
Dostajemy zatem układ równań
B
3
0
Gra gracza
II
A
B
A
4
0
B
1
4
Strategia dla gracza I jest zatem postaci (3/7A,4/7B).
2y1+y2= 3y1+0y2
y1+y2= 1.
Strategia dla gracza II jest zatem postaci (1/2A,1/2B).
Oczywiście wartość gry (3/2,16/7) odpowiadająca tej równowadze nie jest optymalna w sensie
Pareto (więcej byśmy uzyskali wybierając np. parę strategii (A,A)).
Gry bez równowagi w strategiach czystych (strategie
wyrównujące)
Mając wyliczone strategie każdego z graczy możemy policzyć wypłatę każdego z nich.
Możemy zrobić to na dwa sposoby.
Sposób I
Przemnażając wektor strategii gracza I (3/7A,4/7B) przez dowolny wektor wypłaty
gracza II, tzn. (4,1) jeśli zagra strategię A lub (0,4) jeśli zagra strategię B widzimy, że
gracz II wygrywa 16/7.
Przemnażając wektor strategii gracza II (1/2A,1/2B) przez dowolny wektor wypłaty
gracza I, tzn. (2,1) jeśli zagra strategię A lub (3,0) jeśli zagra strategię B widzimy, że
gracz II wygrywa 3/2.
Sposób II
A
B
A
(2,4)
(1,0)
B
(3,1)
(0,4)
Gra gracza I
A
B
A
2
1
B
3
0
Gra gracza
II
A
B
A
4
0
B
1
4
Wypłatę gracza I i II znajdziemy następująco:
3/7
3/7
2
1
1/2
3
0
1/2
4
0
1/2
3/2
4/7
16/7
4/7
1
4
1/2
Strategie bezpieczeństwa
W tej grze nie ma równowagi (w strategiach czystych). Brak również strategii dominujących.
Gracz I obawiając się, że gracz II będzie minimalizował jego wypłatę sam stara się
minimalizować swoje straty. Zagra zatem w swojej grze strategię minimaksową (tzw. strategią
bezpieczeństwa). Ponieważ jego gra ma punkt siodłowy, więc zagra strategię A. Wówczas
dostanie on wypłatę co najmniej 1 (jest to jego tzw. poziom bezpieczeństwa).
Gracz II obawiając się, że gracz I będzie minimalizował jego wypłatę sam stara się
minimalizować swoje straty. Zagra zatem w swojej grze strategię minimaksową (tzw. strategię
bezpieczeństwa). Ponieważ jego gra nie ma punktu siodłowego szukamy jego strategii
mieszanej. Dostajemy strategię (4/7A,3/7B) i wartość gry gracza II co najmniej 16/7 (jest to jego
tzw. poziom bezpieczeństwa).
Gracz I gra zatem strategię (1A,0B) a gracz II strategię (4/7A,3/7B). Wówczas ich wypłata będzie
równa (11/7,16/7). Ten punkt też nie jest jednak optymalny w sensie Pareto (można dostać
więcej grając na przykład (A,A)).
1
2
1
4/7
3
0
3/7
11/7
0
4
1
0
4/7
16/7
0
1
4
3/7
A
B
A
(2,4)
(1,0)
B
(3,1)
(0,4)
Gra gracza I
A
B
A
2
1
B
3
0
Gra gracza
II
A
B
A
4
0
B
1
4
Strategie kontrbezpieczeństwa
Rozpatrzmy jeszcze raz grę z poprzedniego slajdu.
Jeżeli gracz I gra swoją strategię bezpieczeństwa (rozgrywa swoją grę
metodą minimax), to wybierze strategię A. Jeżeli gracz II to przewidzi, to też
zagra strategię A. Wówczas gracz I dostaje wypłatę 2, a gracz II wypłatę 4,
co jest dla każdego z nich korzystniejsze niż granie przez każdego z nich
swoich strategii bezpieczeństwa.
Jeżeli z kolei gracz II gra swoją strategię bezpieczeństwa (rozgrywa swoją
grę metodą minimax), to wybierze strategię mieszaną (4/7A,3/7B) i wówczas
jego wygrana wyniesie 16/7. Jeżeli gracz I to przewidzi, to obliczy swoje
wypłaty dla swojej strategii A i strategii B:
gracz I gra A: 4/7*2+3/7*1=11/7
A
B
A
(2,4)
(1,0)
B
(3,1)
(0,4)
Gra gracza I
A
B
A
2
1
B
3
0
Gra gracza
II
A
B
A
4
0
B
1
4
gracz I gra B: 4/7*3+3/7*0=12/7
Gracz I powinien zatem wybrać strategię B i wówczas dostanie 12/7. To
rozwiązanie (12/7,16/7) jest oczywiście lepsze dla obu graczy niż granie
przez każdego z nich ich strategii bezpieczeństwa.
Strategię najlepszej odpowiedzi na strategię bezpieczeństwa przeciwnika
nazywamy strategią kontrbezpieczeństwa.
O grach 2x2
Można wykazać, że każda gra dwuosobowa 2×2 o sumie niezerowej
spełnia jeden z poniższych warunków:

ma jedną równowagę,

ma dwie równowagi w strategiach czystych,
ma trzy równowagi: dwie w strategiach czystych i jedną w
strategiach mieszanych,

ma nieskończenie wiele równowag w tym: dwie, trzy lub cztery w
strategiach czystych.

Którą zatem z nich wybrać jeśli jest ich więcej niż jedna?
Którą równowaga najlepsza?
Harsányi i Selten zaproponowali sposób wyboru „najlepszej”
równowagi dla gier 2×2, w których występują dwie równowagi w
strategiach czystych położone na przekątnej tablicy wypłat oraz jedna
równowaga w strategiach mieszanych.
Reguła Seltena i Harsányi:
 ze wszystkich równowag gracze powinni wybrać równowagę
dominującą ze względu na wypłaty,
 jeżeli nie ma równowagi dominującej ze względu na wypłaty,
gracze powinni wybrać równowagę dominującą ze względu na ryzyko.
Równowaga dominująca ze względu na wypłaty
Powiemy, że równowaga Nasha dominuje ze względu na wypłaty
jeśli wypłata każdego z graczy (dla tej równowagi) jest największa
ze zbioru wypłat danego gracza dla wszystkich innych równowag
Nasha (czystych lub mieszanych).
A
B
A
(8,6)
(2,2)
6-2=4
1/3
B
(2,2)
(6,4)
4-2=2
2/3
8-2=6
6-2=4
2/5
3/5
10/3
22/5
Optymalną strategią jest strategia czysta (A,A).
Gracz I dostaje wypłatę 8 (8>6 i 8>22/5).
Gracz II dostaje wypłatę 6 (6>4 i 6>10/3).
Strategie (A,A) jest strategią dominującą ze
względu na wypłaty.
Równowaga dominująca ze względu na ryzyko
Powiemy, że równowaga Nasha dominuje ze względu na ryzko jeśli
odznacza się najmniejszym ryzykiem związanym z wyborem
poszczególnych strategii.
Gracz I zakłada, że gracz II używa strategii C z prawdopodobieństwem q, a strategii
C
D
A
(9,5)
(1,1)
5-1=4
4/5
B
(1,1)
(7,17)
17-1=16
1/5
9-1=8
7-1=6
3/7
4/7
22/5
31/7
D z prawdopodobieństwem 1-q. Wypłata gracza I wynosi:
9q+1(1-q)=8q+1 gdy gracz I gra A
1q+7(1-q)=7-6q gdy gracz I gra B
Ponieważ gracz I preferuje strategię A, więc 8q+1>7-6q, skąd q>3/7.
Gracz II zakłada, że gracz I używa strategii B z prawdopodobieństwem p, a strategii
A z prawdopodobieństwem 1-p. Wypłata gracza II:
1p+5(1-p)=5-4p gdy gracz II gra A
17p+1(1-p)=16p+1 gdy gracz II gra B
Ponieważ gracz II preferuje strategię B, więc 16p+1>5-4p, skąd p>1/5.
Gracz I woli równowagę strategia A, strategia C. Żeby gracz I
wybrał strategię A, prawdopodobieństwo użycia strategii C przez
gracza II musi być większe niż 3/7 .
Gracz II woli równowagę strategia B, strategia D. Żeby gracz II
wybrał strategię D, prawdopodobieństwo użycia strategii B przez
gracza 1 musi być większe niż 1/5
Ponieważ 1/5<3/7, więc gracz II ma poważniejsze powody by wybrać strategię B niż
gracz I strategię A. Zagrane zostanie zatem (B,A) i wypłaty graczy będą (7,17).
Równowaga (B,A) jest dominująca ze względu na ryzyko.
DZIĘKUJĘ ZA UWAGĘ
dr Robert Kowalczyk
Wydział Matematyki i Informatyki UŁ
Download