Drzewka gry. Teoria gier a biznes.

advertisement
Drzewka gry.
Teoria gier a biznes.
1. Gra ekstensywna
2. Strategia
3. Gra o pełnej informacji
4. Metoda indukcji wstecznej
5. Podejmowanie decyzji w warunkach konkurencji
6. Teoria użyteczności
Anna Chojnacka, Matematyka finansowa
studia niestacjonarne
Gra w postaci normalnej – gra macierzowa, gracze
podejmują decyzje jednocześnie lub nie znając
decyzji przeciwników
Gra w postaci ekstensywnej - gracze
podejmują decyzje sekwencyjnie, w miarę
przebiegu gry poznają kolejne ruchy
przeciwnika. Następstwo czasowe ma
kluczowe znaczenie.
Gry ekstensywne można przedstawić za
pomocą drzewka.
2
Przykład 1. (UPROSZCZONY POKER)
Gra odbywa się przy wykorzystaniu talii składającej się tylko z króli i asów.
Na początku gry każdy z graczy dostaje po jednej karcie. Po otrzymaniu kart Pani
Kolumna rozpoczyna rozgrywkę. Może podnieść stawkę albo spasować. Jeśli spasuje,
Pan Wiersz zgarnia całą pulę, jeśli podbije stawkę Pan Wiersz może sprawdzić (czyli
zaakceptować grę o wyższą stawkę) albo spasować. Gdy Pan Wiersz spasuje, całą
stawkę dostaje Pani Kolumna. Jeśli sprawdzi, wygrywa ten kto ma wyższe karty, jeśli
oboje mają takie same karty pula dzielona jest po równo między graczy.
wypłaty (Wiersz, Kolumna)
3
Drzewko gry przedstawia sekwencję ruchów, gdzie:
• Każdy wewnętrzny węzeł (wierzchołek) przypisany jest
któremuś z graczy , wykonującemu z niego ruch
• Każda z gałęzi wyprowadzona w dół z danego węzła
reprezentuje możliwy ruch gracza
• Każdemu węzłowi końcowemu przypisane są wypłaty obu
graczy
• Węzły należące do każdego gracza podzielone są na zbiory
informacyjne (linie przerywane). Wykonując ruch, gracz
wie, w którym zbiorze informacyjnym aktualnie się znajduje,
nie wie jednak, w którym z jego węzłów.
• Z każdego z węzłów należących do tego samego zbioru
informacyjnego wyprowadzona jest taka sama liczba gałęzi,
oznaczanych w taki sam sposób
4
Każdą grę w postaci ekstensywnej można sprowadzić do gry w postaci
normalnej. Tzn. każde drzewko gry można sprowadzić do gry macierzowej.
To co łączy ze sobą oba przedstawienia gry to idea strategii.
Dla gry w postaci drzewka strategią gracza możemy określić dokładny spis
ruchów, jakie wykonałby gracz w przypadku znalezienia się w każdym ze
zbiorów informacyjnych (ZBI), w których mógłby się znaleźć w trakcie
przebiegu rozgrywki.
W przykładzie 1. strategia Pani Kolumny mogłaby wglądać tak:
• Będąc w I ZBI („mam w ręku asa”) – podnoszę
stawkę
• Będąc w II ZBI („mam w ręku króla”) - pasuję
A strategia Pana Wiersza
• I ZBI - „Mam w ręku asa” – sprawdzam
• II ZBI - „Mam w ręku króla” - pasuję
5
Dokładniej, w tej grze każdy z graczy posiada 4 możliwe strategie (każdy ma dwa
ZBI po dwa ruchy do wyboru). Mianowicie:
• Mam asa – podnoszę stawkę / sprawdzam
• Mam asa – pasuję
• Mam króla – podnoszę stawkę / sprawdzam
• Mam króla – pasuję
Załóżmy, że prawdopodobieństwo poszczególnych ruchów losu wynosi ¼.
Obliczmy oczekiwane wypłaty Wiersza w zależności od wybory strategii.
1. Oboje z graczy podnoszą stawkę, tylko gdy mają asa. Jeśli mają w ręku króla to
pasują.
1
4
1
1
1
1
∗ 0 + 4 ∗ 1 + 4 ∗ (-1) + 4 ∗ 1 = 4
2. Kolumna zawsze podnosi stawkę, Wiersz sprawdza tylko gdy ma króla.
1
4
1
1
∗ (-1) + 4 ∗ (-1) + 4 ∗(-3) +
1
4
∗ 0= -
5
4
3. Kolumna podnosi stawkę tylko gdy ma króla, Wiersz sprawdza zawsze.
1
4
1
4
1
4
1
4
∗1+ ∗3+ ∗1+ ∗0=
5
4
6
Wyliczając oczekiwane wypłaty Wiersza dla pozostałych 13 możliwych par
strategii otrzymamy postać macierzową gry.
Pani Kolumna podnosi stawkę...
tylko gdy
tylko gdy
zawsze
ma króla
nigdy
ma asa
zawsze
tylko gdy
Pan Wiersz ma asa
sprawdza… tylko gdy
ma króla
nigdy
0
1
1
-
-
-1
0
1
1
0
1
Zamiana gry ekstensywnej na grę macierzową jest teoretycznie możliwa, ale
w praktyce często wygodniej jest analizować bezpośrednio drzewko gry.
7
Gra o pełnej informacji, to taka gra ekstensywna , gdzie:
• Żaden z węzłów nie jest przypisany ruchowi Losu
• Każdy węzeł należy do osobnego zbioru informacyjnego
(nic nie zależy od przypadku, wszyscy gracze znają wszystkie
dotychczas wykonane w grze ruchy).
8
Przykład 2. Kryzys rakietowy.
Gra jest uproszczeniem sytuacji politycznej z okresu zimnej wojny. Grę
rozpoczyna Chruszczow podejmując decyzję, czy na Kubie rozmieścić pociski
rakietowe mające siłę rażenia zagrażającą terytorium USA. Jeżeli zdecyduje się
na rozmieszczenie rakiet, Kennedy ma trzy możliwości: nie zrobić nic, ogłosić
blokadę Kuby, zniszczyć rakiety.
9
Metoda indukcji wstecznej
• Gry o pełnej informacji najczęściej analizuje się
metodą indukcji wstecznej („przycinania drzewka”)
Metoda ta opiera się na założeniu, że gracz zawsze wybierze
tę gałąź drzewka, która powadzi do gorszego wyniku dla
przeciwnika. W ten sposób możemy eliminować pozostałe
gałęzie drzewa. Natomiast przeciwnik wybierze gałąź
prowadzącą do najwyższej dla siebie wpłaty.
10
Zastosujmy metodę indukcji wstecznej do wyznaczenia racjonalnego
wyniku gry z przykładu 2.
Załóżmy, że w kryzysie kubańskim gracze w następujący sposób porządkują
wyniki od najlepszego dla danego gracza do najgorszego:
o Kennedy - w, y, u, v, x, z
o Chruszczow - v, u, w, y, z, x
11
Widzimy, że Chruszczow powinien wybrać gałąź lewą. Zatem
racjonalnym wynikiem jest wypłata v.
W rzeczywistości gracze wybrali inne rozwiązanie.
Dlaczego?
12
Zadanie.
Dla gry z rysunku 5. (następny slajd):
a) Znajdź rozwiązanie racjonalne metodą indukcji
wstecznej
b) Wypisz wszystkie strategie Pani Kolumny
c) Wypisz wszystkie strategie Pana Wiersza
d) Zapis macierz gry
e) Rozwiąż grę macierzową i sprawdź, czy uzyskałeś
ten sam wynik, co za pomocą metody
„przycinania drzewka”
Zaznaczone na drzewku wypłaty to wypłaty dla Wiersza.
13
rysunek 5.
14
a) Pani Kolumna wybierze te gałęzie, które dadzą
gorszy wynik dla Pana Wiersza.
15
Pan Wiersz wybierze gałąź prowadzącą do
najwyższej dla siebie wypłaty.
Rozwiązaniem racjonalnym gry jest wypłata -1.
16
b) Pani Kolumna ma 8 strategii, ponieważ ma 4 ZBI po dwa ruchy do wyboru.
Strategie Pani Kolumny:
I.
Pójść w lewo. Gdy Wiersz wybierze kierunek podążać za nim.
II. Pójść w lewo. Gdy Wiersz wybierze kierunek iść w przeciwną stronę.
III. Pójść w lewo. Gdy Wiersz pójdzie w lewo iść za nim, gdy w prawo iść w
przeciwną stronę.
IV. Pójść w lewo. Gdy Wiersz pójdzie w prawo iść za nim, gdy w lewo iść w
przeciwną stronę.
V. Pójść w prawo. Gdy Wiersz wybierze kierunek podążać za nim.
VI. Pójść w prawo. Gdy Wiersz wybierze kierunek iść w przeciwną stronę.
VII. Pójść w prawo. Gdy Wiersz pójdzie w lewo iść za nim, gdy w prawo iść w
przeciwną stronę.
VIII. Pójść w prawo. Gdy Wiersz pójdzie w prawo iść za nim, gdy w lewo iść w
przeciwną stronę.
17
c) Pan Wiersz ma 4 strategie, ponieważ ma 2 ZBI
po dwa ruchy do wyboru.
Strategie Pana Wiersza:
I. Iść w tym samym kierunku co Kolumna.
II. Iść w przeciwnym kierunku niż Kolumna.
III. Iść zawsze w prawo.
IV. Iść zawsze w lewo.
18
d) Macierz gry
WIERSZ
I
II
III
IV
I
-1
0
0
-1
II
2
1
1
2
III
-1
1
1
-1
Kolumna
IV
V
2
-2
0
-1
0
-2
2
-1
VI
4
3
4
3
VII
4
-1
4
-1
VIII
-2
3
-2
3
Widzimy zatem, że gra ma dwa punkty siodłowe, a jej wartość wynosi -1.
Uzyskaliśmy ten sam wynik co metodą indukcji wstecznej.
19
Rozważając skończoną grę dwuosobową o pełnej
informacji, rozgrywaną przez Białych i Czarnych,
w której możliwe są tylko dwa wyniki: wygrana
Białych lub wygrana Czarnych. Wówczas zawsze
zachodzi:
o Białe mają strategię wygrywającą,
gwarantującą im zwycięstwo niezależnie od
tego, jak grać będą Czarne, albo
o Czarne mają strategię wygrywającą,
gwarantującą im zwycięstwo niezależnie od
tego, jak grać będą Białe.
20
Podejmowanie decyzji w warunkach
konkurencji
W biznesie firmy często podejmują decyzje w
warunkach strategicznej niepewności co do działań
podejmowanych przez inne, konkurencyjne
przedsiębiorstwa. Dodatkowymi czynnikami
niepewności mogą być przy tym przyszła koniunktura
gospodarcza, wielkość rynku dla nowego produktu,
koszty oraz wiele innych zmiennych. Innymi słowy, firmy
często biorą udział w grach z udziałem zarówno innych
graczy jak i losu. W tego typu grach szczególnego
znaczenia nabiera informacja – zarówno dotycząca
działań konkurentów, jak i czynników ogólnie
określanych jako losowe.
21
Rozważmy przypadek dwóch hipotetycznych firm:
Zeus Music:
• Lider produkcji nowoczesnego sprzętu audio
• Jedna z najlepiej rozpoznawalnych marek
Atena Acoustics:
• Mniejsza firma
• Innowacyjna
• Produkująca sprzęt wysokiej jakości
Obie firmy opracowały nowy system dźwiękowy.
Czynnikiem niepewności jest wielkość rynku na tego typu urządzenie.
Może być on mały (potencjalny zysk ok. 24 mln $ rocznie), bądź duży
(ok.40mln $ rocznie).
Obie firmy muszą zdecydować jakiego typu produkt wypuścić na rynek:
• Najwyższej jakości system adresowany do audiofilów
• Tańszy system dla klientów o mniejszych wymaganiach jakościowych
Biorąc pod uwagę profil obu firm można założyć, że Atena jest lepiej
przygotowana do produkcji sprzętu najwyższej jakości natomiast Zeus jako
bardziej rozpoznawalna marka do systemu dla większej rzeszy klientów, ale o
niższej jakości dźwięku.
22
wypłaty dla (Zeus, Atena)
23
Przeanalizujemy tę grę przyjmując różne założenia w
zakresie posiadanych przez graczy informacji.
I. Firmy trzymają w tajemnicy swoje decyzje co do
wyboru kierunku produkcji. Nie znają także
„decyzji” Losu.
Wówczas obie firmy mają dwie strategie:
Produkować sprzęt najwyższej jakości (NJ), bądź sprzęt
tańszy (T).
Policzmy oczekiwane wypłaty:
np. T-T:
1
2
∗ 16, 8 +
1
2
30, 10 = (23, 9)
24
Zeus
T
NJ
Atena
T
NJ
(23, 9)
(18, 14)
(18,14) (20,12)
25
II. Firma Zeus musi podjąć decyzję wcześniej, a
Atena może zdecydować na tyle późno, by
poznać najpierw decyzję Zeusa.
Teraz Atena ma 2 ZBI po dwa ruchy w każdym a co za tym idzie 4 strategie:
• Zawsze wybierać T
• Zawsze wybierać to samo co Zeus
• Zawsze wybierać przeciwnie niż Zeus
• Zawsze wybierać NJ
Wówczas macierz gry wygląda następująco:
T/T
Zeus
T
NJ
Atena
T/NJ
NJ/T
23
23
18
20
NJ/NJ
18
18
18
20
W tej sytuacji wartość gry wynosi 18 dla Zeusa (14 dla Ateny).
26
III. Zeus wykonuje ruch jako pierwszy, ale najpierw
przeprowadza badania rynku, które pozwolą mu
określić wielkość rynku. Atena nie pozna wyników tych
badań, będzie jednak wiedzieć, że takie badania zostały
zlecone przez Zeusa.
W efekcie Zeus ma teraz także 4 strategie.
T/T
Zeus
T/T
T/NJ
NJ/T
NJ/NJ
T/NJ
23
16
25
18
Atena
NJ/T
23
20
23
20
NJ/NJ
18
12
24
18
18
16
22
20
27
Zauważmy, że w tej sytuacji zmieniło się:
• Optymalna strategia Ateny (z „zawsze
wybierać przeciwnie niż Zeus” na „zawsze
wybierać NJ”
• Zeus opierając swą decyzję na badaniach
rynku może powiększyć swoją wypłatę o 4mln.
(badania rynku są opłacalne gdy nie kosztują
więcej niż 4mln)
28
Teraz strategie Zeusa są uzależnione od tego co
„zadecydował” Los.
Strategią dominującą jest:
„ produkować systemy najwyższej jakości jeśli rynek
jest mały, a systemy tańsze jeśli rynek jest duży”
Optymalną strategią gry dla Ateny jest „zawsze
produkować systemy najwyższej jakości”.
Zatem wynik gry to 22(dla Zeusa) i 10 (dla Ateny).
29
Teoria użyteczności
Nauka o przypisywaniu liczb do wyników w taki
sposób, by liczby te odzwierciedlały preferencje
graczy.
Jakie właściwości muszą mieć liczby w macierzy
wypłat, aby praktyczne zastosowania teorii gier
w ogóle miały sens?
30
I. Gra ma punkt siodłowy
Wówczas wymagane jest, aby liczby
reprezentowały uporządkowanie wyników od
najbardziej do najmniej preferowanego wyniku
przez Pana Wiersza (odwrotnie do
uporządkowania Pani Kolumny)
Przykład
Pan Wiersz porządkuje swoje wyniki tak: u, w, x, z, y, v.
Wtedy aby gra była grą o sumie zerowej uporządkowanie Pani
Kolumny musi wyglądać tak: v, y, z, x, w, u.
31
A
Pan
B
Wiersz C
Pani Kolumna
A
B
u
v
w
x
y
z
A
Pan
B
Wiersz C
Pani Kolumna
A
B
6
5
2
1
4
3
32
Zauważmy, że gra będzie mieć punkt siodłowy, i to
w tym samym miejscu, także wtedy gdy
przekształcimy wartości wypłat przez jakąkolwiek
funkcję nie zmieniającą ich uporządkowania. Każda
taka funkcja zachowuje także wszystkie dominacje.
Skalą porządkową – nazywamy skalę, na której
większa wartość reprezentuje bardziej preferowany
wynik. Znaczenie ma jedynie uporządkowanie
wartości.
Użytecznościami porządkowymi – nazywamy
wartości wyznaczone zgodnie z zasadą preferencji.
Pozwalają na wskazywanie punktów siodłowych
oraz dominacji.
33
II. Gra nie ma punktu siodłowego
Wówczas należy zastosować strategie mieszane.
Przykład.
Pan
A
Wiersz B
Pani Kolumna
A
B
a
b
c
d
różnice
d-c
a-b
Niech a > b i d > c. Wówczas optymalną strategią Pana
Wiersza jest strategia mieszana.
𝑑−𝑐
𝑑−𝑐 +(𝑎−𝑏)
𝐴,
𝑎−𝑏
𝑑−𝑐 +(𝑎−𝑏)
B
34
Aby miało to sens, wartości wypłat muszą być
przypisane wynikom w taki sposób, aby proporcja
(𝑑−𝑐)
dwóch różnic
była interpretowalna.
(𝑎−𝑏)
Skalą interwałową (przedziałową) nazywamy skalę, przy
której można interpretować nie tylko uporządkowanie
wartości, ale także proporcje pomiędzy różnicami
różnych wartości.
Liczby oddające preferencje mierzone w skali
interwałowej nazywamy użytecznościami kardynalnymi.
Aby rozwiązanie gry w strategiach mieszanych miało
sens, liczby wpisane w macierz gry muszą być
użytecznościami kardynalnymi.
35
Download