Pojęcie gry, gry macierzowe: dominacje i punkty siodłowe

advertisement
Teorię gier można określić jako teorię
podejmowania decyzji w szczególnych
warunkach. Zajmuje się ona logiczną analizą
sytuacji konfliktu i kooperacji; bada jak gracze
racjonalnie powinni rozgrywać grę.
Prezentacja
przygotowana przez:
Daria Sitkowska
Katarzyna Urbaniak
Aby można było mówid o grze, należy określid kilka
pojęd:
1. Gracz – uczestnik sytuacji, może nim byd człowiek,
firma, paostwo, gatunek w znaczeniu biologicznym; w
grze musi byd co najmniej dwóch graczy
2. Strategia – możliwośd postępowania każdego z
graczy, sposób rozgrywania przez niego gry
3. Wynik gry – determinowany jest przez kombinacje
strategii wybieranych przez poszczególnych graczy
4. Wypłata – określa wartośd wyniku gry dla
poszczególnych graczy, można ją wyrazid liczbowo;
poszczególne wyniki są przyporządkowane pewnym
zbiorom strategii
Ponieważ gra to dowolna sytuacja konfliktowa
lub kooperacyjna to wyjaśnijmy te pojęcia:
Konflikt – mamy z nim do czynienia,
ponieważ zazwyczaj każdy z graczy dąży do
innego wyniku gry
Kooperacja – jest możliwa, gdy kilku graczy
koordynuje swoje strategie, by doprowadzić do
wyniku dającego każdemu z nich wyższą
wypłatę
W praktyce teoria gier ma pewne ograniczenia:
1. Gry rozgrywane w rzeczywistym świecie są
bardzo skomplikowane – wskazanie wszystkich
graczy, opisanie ich strategii, możliwych
wyników i wartości wypłat jest trudne. Możliwe
jest konstruowanie prostych gier dotyczących
niektórych istotnych elementów rzeczywistości.
2. Teoria gier zakłada, że gracze zachowują się
racjonalnie – w realnym świecie nie zawsze ma
to miejsce
3. Teoria gier nie potrafi dokładnie przewidzieć
przebiegu gier, w których interesy obu graczy
nie są dokładnie przeciwstawne i w których
bierze udział więcej niż dwóch graczy
Gra o sumie zerowej – gra, w której interesy
obu graczy są dokładnie przeciwstawne; osoba
pierwsza wygrywa dokładnie tyle, ile przegrywa
druga. Takie gry stanowią modele dla sytuacji
czystego konfliktu dwóch stron.
Przykład:

Gra:
Wypłata osoby I
Dla takich gier wystarczy podać wypłaty
jednego gracza. Wypłatę drugiego uzyskamy
mnożąc wypłatę pierwszego przez -1.
Analizując sposób, w jaki gracze powinni
rozegrać taką grę, możemy ją zapisać także
jako diagram przesunięć. Strzałki
przeprowadzamy w następujący sposób:
- w poszczególnych wierszach prowadzimy je
z każdej komórki do komórki z najmniejszą
wartością
- w kolumnach prowadzimy je z każdej
komórki do komórki z największą wartością w
danej kolumnie
Gra o sumie niezerowej - gra, w której wypłaty
obu graczy nie sumują się do zera.
Przykład:
Gra macierzowa – gra dwuosobowa o sumie
zerowej, która jest macierzą m x n, gdzie m to
liczba strategii jednej osoby, a n to liczba
strategii drugiej. Celem osoby pierwszej jest
taki wybór wiersza, by uzyskać wynik
reprezentowany
przez największą
wartość,
drugiej – wybór
kolumny,
w której wynik
gry jest liczbą
najmniejszą.
Definicja
Strategia S dominuje strategię T, jeżeli każdy
wynik dawany przez S jest co najmniej równie
korzystny co odpowiedni wynik dawany przez
T, a przynajmniej jeden
wynik dawany
przez S jest
bardziej
korzystny niż
odpowiedni
wynik dawany
przez T.
Kryterium dominacji.
Racjonalny gracz nigdy nie wybiera strategii
zdominowanej (mniej korzystnej).
Kryterium to pozwala czasami wyeliminować
niektóre strategie, ale ma dość ograniczone
zastosowanie.
Przykład:
- Dla osoby II strategia B jest bezwzględnie lepsza
niż C, bo w każdej komórce B znajduje się liczba
mniejsza niż w odpowiedniej komórce kolumny C.
- Mówimy, że strategia B dominuje strategię C lub
strategia C jest zdominowana przez strategię B.
- Można zauważyć też, że strategie B i C są
najbezpieczniejsze.
- Para strategii C osoby I i B osoby II daje wynik
będący punktem równowagi. Znaczy to tyle, że
strategie te są wzajemnie najlepszymi
odpowiedziami na siebie. W takim przypadku
wypłata dla tej pary strategii jest jednocześnie
największa w swoim wierszu i najmniejsza w
swojej kolumnie.
Definicja punktu siodłowego
Wynik gry macierzowej (dla macierzy
zawierającej wypłaty gracza wybierającego
wiersze) nazywamy punktem siodłowym, jeżeli
jego wartość jest mniejsza lub równa każdej
wartości w jego wierszu, a większa lub równa
każdej wartości w jego kolumnie.
Kryterium punktu siodłowego.
Jeżeli gra macierzowa ma punkt siodłowy, obaj
gracze powinni wybrać zawierające go
strategie.
Definicja wartości gry
Dla każdej gry macierzowej, dla której istnieje
taka liczba v, że osoba I ma strategię
gwarantującą jej wygranie co najmniej v, a
osoba II ma strategię gwarantującą, że osoba I
nie wygra więcej, v jest wartością gry.
Jeżeli gra ma punkt siodłowy , to jego wartość
jest wartością gry.
Niektóre gry nie mają żadnego punktu
siodłowego, inne mają ich kilka.
Gdy gra ma wiele punktów siodłowych,
wszystkie one są ze sobą powiązane – mają tę
samą wartość i leżą na wierzchołkach jednego
prostokąta.
Twierdzenie
Każde dwa punkty siodłowe tej samej gry mają
taką samą wartość. Jeżeli zarówno osoba I, jak i
osoba II zagrają strategie zawierające punkty
siodłowe, to wynik gry zawsze będzie punktem
siodłowym.
Metoda określania, czy gra ma punkt siodłowy i
jeśli tak, pozwalająca go znaleźć:
- wypisujemy najmniejsze wartości z każdego
wiersza i wybieramy największą spośród nich
- wypisujemy największe wartości z każdej
kolumny i wybieramy najmniejszą z nich
Jeśli maksimin wierszy i minimaks kolumn jest
taki sam, to leży on w punkcie siodłowym
Jeżeli maksimin i minimaks mają różne wartości,
gra nie posiada punktu siodłowego
Przykład:
Zad.1
W następującej grze
wskaż wszystkie
zdominowane i
dominujące
strategie obu
graczy.
Rozwiązanie:
Kolumna:
- C dominuje A, bo 2≤3, 0≤2, -5≤-4 (A jest
zdominowana przez C)
- B dominuje D, bo -6≤-4, 1≤1, 3≤4 (D jest
zdominowana przez B)
Wiersz:
- brak strategii zdominowanych
Kryterium dominacji wyższego rzędu – głosi ono, że gracze
mogą wybierać jedynie te strategie, które przetrwają proces
eliminacji polegający na tym, że w pierwszym kroku skreślamy
wszystkie strategie zdominowane, uzyskując w ten sposób
nową, mniejszą grę. W tej mniejszej grze niektóre strategie
mogą znów być zdominowane, pomimo że nie były
zdominowane w grze oryginalnej, znajdujemy je i skreślamy,
otrzymując ponownie zmniejszoną grę. Powtarzamy ten
proceder, dopóki w uzyskanej grze nie ma już żadnych strategii
zdominowanych.
Zad.2
Które ze strategii w poniższej grze są
dopuszczalne ze względu na kryterium
dominacji
wyższego
rzędu?
Rozwiązanie:
Krok 1:
- kB dominuje kA, bo 1≤1, 1≤2, 2≤2, 2≤2 (kA
jest zdominowana przez kB)
- kC dominuje kB, bo 1≤1, 1≤1, 1≤2, 2≤2 (kB
jest zdominowana przez kC)
Krok 2:
-wA dominuje wB, bo 1≥1, 2≥1, 2≥2 (wB jest
zdominowany przez wA)
-wB dominuje wC, bo 1≥1, 1≥1, 2≥1 (wC jest
zdominowany przez wB)



Krok3:
-kE dominuje nad kD, bo 2≤2, 0≤1 (kD jest
zdominowana przez kE)
Strategie A i D dla Wiersza oraz strategie C i E
dla Kolumny są dopuszczalne ze względu na
kryterium dominacji wyższego rzędu.
Zad.3
Wyznacz w poniższych grach wszystkie punkty
siodłowe, a dla gier b) i c) narysuj diagramy
przesunięć.
Rozwiązanie:
a) 4 punkty siodłowe
b) 1 punkt siodłowy
c) Brak punktów siodłowych
Do tej pory mieliśmy do czynienia z grami w
których minimaks wierszy i maksimin kolumn
mają różne wartości i w efekcie gry te nie mają
punktów siodłowych. Przykładem (*) takiej gry
jest:
Żaden z uczestników tej gry nie ma
strategii, którą opłacałoby mu się stale
stosować – przy braku punktu siodłowego
znajomość strategii przeciwnika można
skutecznie wykorzystać przeciwko
niemu!! W tej sytuacji jedynym
sensownym rozwiązaniem jest
każdorazowy wybór konkretnej
strategii w drodze losowania.
Taka metoda, polegająca na
losowaniu jednej z kilku strategii
z określonymi
prawdopodobieństwami,
nazywana jest strategią mieszaną,
w odróżnieniu od strategii czystej,
gdy gracz wybiera, bez losowania
jedną konkretną strategię.
Aby zbadać, jakie skutki może mieć zastosowanie
przez jednego lub obu graczy strategii mieszanych,
posłużymy się pojęciem wartości oczekiwanej.
DEFINICJA
Wartością oczekiwaną dla danych wypłat a1,a2,…,an
uzyskiwanych z prawdopodobieństwami odpowiednio
p1,p2,…,pn jest liczba a1p1+a2p2+…+anpn.
Wartość oczekiwana wypłaty jest średnią możliwych
wypłat, ważoną ze względu na prawdopodobieństwo
ich uzyskania.
KRYTERIUM WARTOŚCI OCZEKIWANEJ.
Jeżeli wiesz, że Twój przeciwnik gra określoną strategię
i będzie ją stosować niezależnie od tego, jak ty grasz,
powinieneś stosować strategię dającą ci największą
wartość oczekiwaną wypłaty.
Warto się zastanowić, w jaki sposób może w praktyce
wyglądać stosowanie strategii mieszanej np. 3/4A i
1/4B. Oto kilka możliwości:
• Można rzucać dwiema monetami i grać B
tylko wtedy gdy wypadły dwa orły;
• Na ślepo wybrać z talii kart jedną i grać B
tylko wtedy, gdy wybraną kartą jest pik;
• Wrzucić do kapelusza trzy karteczki
z napisem „A” oraz jedną z napisem „B” i losować;
• Sprawdzić sekundy na cyfrowym zegarku i zagrać B,
jeśli ich liczba jest podzielna przez 4;
• Użyć komputera do wygenerowania liczby losowej z
przedziału od 0 do 1, zagrać B, jeśli liczba ta będzie
większa niż 0,75.
Jak w przykładzie (*) powinien postępować Pan Wiersz?
Jeśli Pan Wiersz wybierze strategię pA, (1-p)B, która nie pozwala uzyskać Pani Kolumnie
przewagi, Pan Wiersz musi wykonać rachunki:
Jeśli Kolumna zagra A px2+(1-p)x0=2p
Jeśli Kolumna zagra B px(-3)+(1-p)x3=3-6p
Rozwiązując równanie 2p=3-6p uzyskujemy p=3/8. Jeżeli Pan Wiersz zagra strategię
mieszaną 3/8A, 5/8B, gwarantuje sobie oczekiwaną wartość wygranej wynoszącą co
najmniej ¾ niezależne od tego jaką strategię zagra Pani Kolumna.(3/8x2+ 3/8x0 =3/8x(-3)+
5/8x3).
Analizując nasze zadnie do końca otrzymujemy podobną sytuację, jak w przypadku gier
mających punkt siodłowy. Pan Wiersz ma (mieszaną) strategię gwarantującą mu
(oczekiwaną) wypłatę wynoszącą co najmniej ¾. Pani Kolumna ma (mieszaną) strategię
gwarantującą jej, że (oczekiwana) wypłata Wiersza wyniesie co najwyżej ¾. Analogicznie jak
w przypadku punktu siodłowego, w teorii gier przyjmuje się, że:
• Wartość tej gry wynosi ¾;
• Optymalną strategią Pani Kolumny jest ¾ A i ¼ B;
• Optymalną strategią Pana Wiersza jest 3/8 A i 5/8 B.
Wartość gry oraz obie
optymalne strategie
stanowią łącznie
rozwiązanie gry.
W książce [Williams, 1986] można
znaleźć prostą metodę wyznaczania
rozwiązania w strategiach mieszanych
gier 2x2 nie mających punktu
siodłowego.
Aby określić w jakich proporcjach Pan
Wiersz ma grać strategie A i B należy
dla każdego wiersza określić wartość bezwzględną z różnicy
pomiędzy poszczególnymi wypłatami, a następnie zamienić je
miejscami. Podobnie u Pani Kolumny. Należy jednak pamiętać aby
przed użyciem tej metody upewnić się, że gra nie ma punktu
siodłowego, gdyż w takim przypadku metoda jest nieskuteczna!
Warto zająć się teraz grami 2xn, w których Pan Wiersz ma dwie
czyste strategie, a Pani Kolumna n>2 czystych strategii oraz grami
mx2 (Pan Wiersz ma m strategii, zaś Kolumna 2 czyste strategie).
Jeśli gra taka nie ma punktu siodłowego to jej rozwiązaniem
zawsze jest rozwiązanie w strategiach mieszanych jednej
z jej podgier 2 x 2.
Istnieje graficzna metoda
znajdowania podgry 2x2
pozwalająca wyznaczyć
rozwiązanie gry 2xn
lub mx2,
dająca przy okazji
geometryczną
ilustrację pojęcia
rozwiązania gry.
Rozważmy grę =>
Wykres przedstawiony po prawo
powstał w ten sposób, że kolejno dla
każdej strategii Wiersza na lewej osi
zaznaczyliśmy wypłatę Wiersza, gdy
Kolumna gra A, na prawej osi wypłatę
Wiersza, gdy Kolumna gra B, a
następnie narysowaliśmy odcinek
łączący oba te punkty. Zauważmy, że
wartość drugiej współrzędnej
(wysokość) punktu należącego do
tego odcinka, leżącego nad punktem
p odpowiada oczekiwanej wypłacie
Wiersza, gdy kolumna gra strategię
(1-p)A, p B.
Jeśli Pan Wiersz wie lub domyśla się, jaką strategię mieszaną
zagra Pani Kolumna, to może wybrać strategię będącą
najlepszą odpowiedzią na strategię Kolumny – w takim
wypadku wynik gry będzie odpowiadał któremuś z punktów
na górnej łamanej (rys. zaznaczony czerwoną kreską).
Pani Kolumna wybierze takie p aby wypłata Wiersza była
najmniejsza, czyli taką strategię, aby wynik
wypadł w najniższym punkcie górnej łamanej. Ponieważ
punkt ten leży na przecięciu linii odpowiadających
strategiom A i B Wiersza, rozwiązaniem całej gry będzie
rozwiązanie podgry.
Pan Wiersz powinien zagrać strategie 2/7 A, 5/7 B, zaś C nie
powinien grać w ogóle! Możemy sprawdzić, że jest to rozwiązanie
wykonując obliczenia
Oczekiwany wynik gry Oczekiwany wynik gry w
w tabeli obok =>
w zależności od
zależności od decyzji
Wszystkie wyniki
decyzji Wiersza gdy
Kolumny, gdy Wiersz gra
w lewej kolumnie
𝟓
𝟐
𝟓
Kolumna gra ( )A,
( )A, ( )B, (0)C
𝟕
𝟕
𝟕
są mniejsze lub
𝟐
( )B
równe 4/7, a w prawej
𝟕
większe lub równe 4/7
Gdy Wiersz gra A:
Gdy Kolumna gra A:
-Kolumna wie,
𝟓
𝟐
𝟒
𝟐
𝟓
że Wiersz przy takiej
∗ 𝟐 + ∗ −𝟑 =
∗ 𝟐 + ∗ 𝟎 + 𝟎 ∗ (−𝟓) =
𝟕
𝟕
𝟕
𝟕
𝟕
strategii wygra (średnio)
nie więcej niż 4/7,
zaś Wiersz może sobie
Gdy Kolumna gra B
zapewnić (oczekiwaną) Gdy Wiersz gra B
wygraną nie mniejszą
𝟓
𝟐
𝟒
𝟐
𝟓
∗𝟎+ ∗𝟐=
∗ (−𝟑) + ∗ 𝟐 + 𝟎 ∗ 𝟏𝟎 =
𝟕
𝟕
𝟕
𝟕
𝟕
niż 4/7, będące
wartością gry.
Gdy Wiersz gra C
𝟓
𝟐
∗ −𝟓 + ∗ 𝟏𝟎
𝟕
𝟕
𝟓
= −
𝟕
𝟒
𝟕
𝟒
𝟕
Wracając do diagramu: najniższy
punkt górnej łamanej znajduje
się nad p=2/7, na wysokości
oznaczonej jako 4/7 (wartość
gry). Punkt należący do strategii
C Wiersza, znajdujący się nad
x=2/7 leży niżej i odpowiada
wypłacie -5/7 i dlatego Wiersz
nigdy nie zagra C.
Do rozwiązywania takich gier stosuje się analogiczną
metodę graficzną z jedną istotną zmianą. Przykład:
Wtedy Pani Kolumna tak wybiera strategię, aby wynik
gry leżał na dolnej łamanej, natomiast Pan Wiersz gra
tak aby osiągnąć najwyższy punkt!
Gra 2xN
Dla Pani Kolumny oznacza to,
że powinna grać strategię
mieszaną A i C.
Optymalne strategie mieszane
obu graczy
przedstawiają się
następująco:
Kolumna (2/7;0;5/7;0;0)
Wiersz (4/7;3/7)
Sprawdzając
wyniki
mamy:
Kolumna
(2/7;0;5/7;0;0)
Wiersz
(4/7;3/7)
Oczekiwany wynik gry w zależności Oczekiwany wynik gry w
od decyzji Wiersza gdy Kolumna
zależności od decyzji
Kolumny, gdy Wiersz gra
gra swoją strategię optymalną
swoją strategię optymalną
Gdy Wiersz gra A:
𝟐
𝟕
∗ (−𝟐) +
𝟓
𝟕
∗𝟏=
Gdy Kolumna gra A:
𝟏
𝟕
Gdy Wiersz gra B
𝟐
𝟓
𝟏
∗ 𝟑 + ∗ (−𝟏) =
𝟕
𝟕
𝟕
𝟒
𝟑
𝟏
∗ (−𝟐) + ∗ 𝟑 =
𝟕
𝟕
𝟕
Gdy Kolumna gra B
𝟒
𝟑
𝟏𝟏
∗ 𝟓 + ∗ (−𝟑) =
𝟕
𝟕
𝟕
Gdy Kolumna gra C
𝟒
𝟑
𝟏
∗ 𝟏 + ∗ (−𝟏) =
𝟕
𝟕
𝟕
Gdy Kolumna gra D
𝟒
𝟑
𝟗
∗𝟎+ ∗𝟑=
𝟕
𝟕
𝟕
Gdy Kolumna gra E
𝟒
𝟑
𝟖
∗ −𝟒 + ∗ 𝟖 =
𝟕
𝟕
𝟕
Wartość gry wynosi 1/7! Aby sprawdzić czy
poprawnie wskazaliśmy wartość gry należy
skontrolować czy wszystkie wartości oczekiwane
wyniku, gdy Kolumna gra przeciwko optymalnej
strategii Wiersza są nie mniejsze niż 1/7 :
Jeśli chociaż jedna z nich byłaby mniejsza niż 1/7,
to rozwiązując grę musieliśmy się pomylić!
Co z grami w których obaj gracze mogą wybierać
spośród więcej niż
dwóch strategii?
Na szczęście (!)
mamy twierdzenie Johna von Neumanna mówiące,
że każda gra macierzowa ma rozwiązanie:
Każda gra macierzowa m x n ma rozwiązanie, tzn.
istnieje dokładnie jedna liczba v nazwana
„wartością gry”, oraz optymalne strategie (czyste
lub mieszane) obu graczy takie, że
1) Jeżeli Wiersz gra swoją optymalną strategię, to
jego oczekiwana wypłata będzie większa lub równa
v, niezależnie od tego, jaką strategię będzie grała
Kolumna:
2) Jeżeli Kolumna gra swoją optymalną strategię, to
oczekiwana wypłata Wiersza będzie mniejsza lub
równa v, niezależnie od tego jaką strategię będzie
grał Wiersz.
Ponadto, rozwiązanie gry macierzowej m x n zawsze jest
rozwiązaniem jakiejś jej podgry k x k.
Innymi słowy, rozwiązaniem gry m x n albo jest rozwiązanie
podgry 1x1 (wówczas gra ma punkt siodłowy), bądź też
podgry 2x2, 3x3 lub większej.
Czyste strategie, które
wchodzą do rozwiązania
gry, nazywamy
strategiami aktywnymi;
gracze wybierają
z odpowiednimi
prawdopodobieństwami
– strategie aktywne;
pozostałe w ogóle nie są
grane.
Należy pamiętać,
że metoda wyrównywania
wartości oczekiwanych
zawiedzie, jeśli rozwiązaniem
gry 3x3 jest rozwiązanie
podgry 2x2 lub 1x1.
Zanim zastosujemy tę metodę,
trzeba sprawdzić czy gra
nie ma punktu siodłowego
lub strategii zdominowanych;
a jeżeli metoda ta zawiedzie,
należy szukać rozwiązania
wśród rozwiązań podgier
2x2( najłatwiej stosując graficzną
metodę rozwiązywania dla trzech
podgier 3x2).
Na tej zasadzie można teoretycznie
rozwiązać każdą grę macierzową,
jednak jest to w praktyce strasznie mozolne!
Najefektywniejszą metodą rozwiązywania
dużych gier jest jednak
technika programowania liniowego. Większość
pakietów komputerowych które zawierają
programowanie liniowe, oferuje
opcję rozwiązywania gier macierzowych.
Zad 1
a) Co dzieje się, gdy próbujemy wyznaczyć strategię
Kolumny wyrównującą wartości oczekiwane wypłat
Wiersza dla gry 2x2 mającej punkt siodłowy?
Rozważmy grę:
Powyższa gra posiada punkt siodłowy.
Nie zauważając tego możemy starać się wyznaczyć
strategię Kolumny wyrównując wartości oczekiwane
wypłat Wiersza.
Niech Kolumna gra pA, (1-p)B:
Jeśli Wiersz gra A: p*0+(1-p)*1=1-p
Jeśli Wiersz gra B: p*3+(1-p)*3=3
1-p=3
-p=2
p=-2 a to nie jest możliwe bo p nie należy do
<0,1>
b) Co się dzieję, gdy do gry 2x2 mającej punkt
siodłowy próbujemy zastosować metodę
proporcji Williamsa?
Rozważmy grę:
Wówczas próbując rozwiązać metodą proporcji
mamy:
Zadanie 2
Rozwiąż następujące gry:
Zadanie 3
Niektóre gry mogą mieć więcej niż jedno
rozwiązanie. W każdym z nich wartość gry jest
taka sama, ale gracze mogą mieć kilka różnych
strategii, które gwarantują im osiągnięcie tej
wartości. Rozwiąż poniższą grę metodą graficzną.
Co zauważyłeś?
Download