Drzewka gry. Teoria gier a biznes. 1. Gra ekstensywna 2. Strategia 3. Gra o pełnej informacji 4. Metoda indukcji wstecznej 5. Podejmowanie decyzji w warunkach konkurencji 6. Teoria użyteczności Anna Chojnacka, Matematyka finansowa studia niestacjonarne Gra w postaci normalnej – gra macierzowa, gracze podejmują decyzje jednocześnie lub nie znając decyzji przeciwników Gra w postaci ekstensywnej - gracze podejmują decyzje sekwencyjnie, w miarę przebiegu gry poznają kolejne ruchy przeciwnika. Następstwo czasowe ma kluczowe znaczenie. Gry ekstensywne można przedstawić za pomocą drzewka. 2 Przykład 1. (UPROSZCZONY POKER) Gra odbywa się przy wykorzystaniu talii składającej się tylko z króli i asów. Na początku gry każdy z graczy dostaje po jednej karcie. Po otrzymaniu kart Pani Kolumna rozpoczyna rozgrywkę. Może podnieść stawkę albo spasować. Jeśli spasuje, Pan Wiersz zgarnia całą pulę, jeśli podbije stawkę Pan Wiersz może sprawdzić (czyli zaakceptować grę o wyższą stawkę) albo spasować. Gdy Pan Wiersz spasuje, całą stawkę dostaje Pani Kolumna. Jeśli sprawdzi, wygrywa ten kto ma wyższe karty, jeśli oboje mają takie same karty pula dzielona jest po równo między graczy. wypłaty (Wiersz, Kolumna) 3 Drzewko gry przedstawia sekwencję ruchów, gdzie: • Każdy wewnętrzny węzeł (wierzchołek) przypisany jest któremuś z graczy , wykonującemu z niego ruch • Każda z gałęzi wyprowadzona w dół z danego węzła reprezentuje możliwy ruch gracza • Każdemu węzłowi końcowemu przypisane są wypłaty obu graczy • Węzły należące do każdego gracza podzielone są na zbiory informacyjne (linie przerywane). Wykonując ruch, gracz wie, w którym zbiorze informacyjnym aktualnie się znajduje, nie wie jednak, w którym z jego węzłów. • Z każdego z węzłów należących do tego samego zbioru informacyjnego wyprowadzona jest taka sama liczba gałęzi, oznaczanych w taki sam sposób 4 Każdą grę w postaci ekstensywnej można sprowadzić do gry w postaci normalnej. Tzn. każde drzewko gry można sprowadzić do gry macierzowej. To co łączy ze sobą oba przedstawienia gry to idea strategii. Dla gry w postaci drzewka strategią gracza możemy określić dokładny spis ruchów, jakie wykonałby gracz w przypadku znalezienia się w każdym ze zbiorów informacyjnych (ZBI), w których mógłby się znaleźć w trakcie przebiegu rozgrywki. W przykładzie 1. strategia Pani Kolumny mogłaby wglądać tak: • Będąc w I ZBI („mam w ręku asa”) – podnoszę stawkę • Będąc w II ZBI („mam w ręku króla”) - pasuję A strategia Pana Wiersza • I ZBI - „Mam w ręku asa” – sprawdzam • II ZBI - „Mam w ręku króla” - pasuję 5 Dokładniej, w tej grze każdy z graczy posiada 4 możliwe strategie (każdy ma dwa ZBI po dwa ruchy do wyboru). Mianowicie: • Mam asa – podnoszę stawkę / sprawdzam • Mam asa – pasuję • Mam króla – podnoszę stawkę / sprawdzam • Mam króla – pasuję Załóżmy, że prawdopodobieństwo poszczególnych ruchów losu wynosi ¼. Obliczmy oczekiwane wypłaty Wiersza w zależności od wybory strategii. 1. Oboje z graczy podnoszą stawkę, tylko gdy mają asa. Jeśli mają w ręku króla to pasują. 1 4 1 1 1 1 ∗ 0 + 4 ∗ 1 + 4 ∗ (-1) + 4 ∗ 1 = 4 2. Kolumna zawsze podnosi stawkę, Wiersz sprawdza tylko gdy ma króla. 1 4 1 1 ∗ (-1) + 4 ∗ (-1) + 4 ∗(-3) + 1 4 ∗ 0= - 5 4 3. Kolumna podnosi stawkę tylko gdy ma króla, Wiersz sprawdza zawsze. 1 4 1 4 1 4 1 4 ∗1+ ∗3+ ∗1+ ∗0= 5 4 6 Wyliczając oczekiwane wypłaty Wiersza dla pozostałych 13 możliwych par strategii otrzymamy postać macierzową gry. Pani Kolumna podnosi stawkę... tylko gdy tylko gdy zawsze ma króla nigdy ma asa zawsze tylko gdy Pan Wiersz ma asa sprawdza… tylko gdy ma króla nigdy 0 1 1 - - -1 0 1 1 0 1 Zamiana gry ekstensywnej na grę macierzową jest teoretycznie możliwa, ale w praktyce często wygodniej jest analizować bezpośrednio drzewko gry. 7 Gra o pełnej informacji, to taka gra ekstensywna , gdzie: • Żaden z węzłów nie jest przypisany ruchowi Losu • Każdy węzeł należy do osobnego zbioru informacyjnego (nic nie zależy od przypadku, wszyscy gracze znają wszystkie dotychczas wykonane w grze ruchy). 8 Przykład 2. Kryzys rakietowy. Gra jest uproszczeniem sytuacji politycznej z okresu zimnej wojny. Grę rozpoczyna Chruszczow podejmując decyzję, czy na Kubie rozmieścić pociski rakietowe mające siłę rażenia zagrażającą terytorium USA. Jeżeli zdecyduje się na rozmieszczenie rakiet, Kennedy ma trzy możliwości: nie zrobić nic, ogłosić blokadę Kuby, zniszczyć rakiety. 9 Metoda indukcji wstecznej • Gry o pełnej informacji najczęściej analizuje się metodą indukcji wstecznej („przycinania drzewka”) Metoda ta opiera się na założeniu, że gracz zawsze wybierze tę gałąź drzewka, która powadzi do gorszego wyniku dla przeciwnika. W ten sposób możemy eliminować pozostałe gałęzie drzewa. Natomiast przeciwnik wybierze gałąź prowadzącą do najwyższej dla siebie wpłaty. 10 Zastosujmy metodę indukcji wstecznej do wyznaczenia racjonalnego wyniku gry z przykładu 2. Załóżmy, że w kryzysie kubańskim gracze w następujący sposób porządkują wyniki od najlepszego dla danego gracza do najgorszego: o Kennedy - w, y, u, v, x, z o Chruszczow - v, u, w, y, z, x 11 Widzimy, że Chruszczow powinien wybrać gałąź lewą. Zatem racjonalnym wynikiem jest wypłata v. W rzeczywistości gracze wybrali inne rozwiązanie. Dlaczego? 12 Zadanie. Dla gry z rysunku 5. (następny slajd): a) Znajdź rozwiązanie racjonalne metodą indukcji wstecznej b) Wypisz wszystkie strategie Pani Kolumny c) Wypisz wszystkie strategie Pana Wiersza d) Zapis macierz gry e) Rozwiąż grę macierzową i sprawdź, czy uzyskałeś ten sam wynik, co za pomocą metody „przycinania drzewka” Zaznaczone na drzewku wypłaty to wypłaty dla Wiersza. 13 rysunek 5. 14 a) Pani Kolumna wybierze te gałęzie, które dadzą gorszy wynik dla Pana Wiersza. 15 Pan Wiersz wybierze gałąź prowadzącą do najwyższej dla siebie wypłaty. Rozwiązaniem racjonalnym gry jest wypłata -1. 16 b) Pani Kolumna ma 8 strategii, ponieważ ma 4 ZBI po dwa ruchy do wyboru. Strategie Pani Kolumny: I. Pójść w lewo. Gdy Wiersz wybierze kierunek podążać za nim. II. Pójść w lewo. Gdy Wiersz wybierze kierunek iść w przeciwną stronę. III. Pójść w lewo. Gdy Wiersz pójdzie w lewo iść za nim, gdy w prawo iść w przeciwną stronę. IV. Pójść w lewo. Gdy Wiersz pójdzie w prawo iść za nim, gdy w lewo iść w przeciwną stronę. V. Pójść w prawo. Gdy Wiersz wybierze kierunek podążać za nim. VI. Pójść w prawo. Gdy Wiersz wybierze kierunek iść w przeciwną stronę. VII. Pójść w prawo. Gdy Wiersz pójdzie w lewo iść za nim, gdy w prawo iść w przeciwną stronę. VIII. Pójść w prawo. Gdy Wiersz pójdzie w prawo iść za nim, gdy w lewo iść w przeciwną stronę. 17 c) Pan Wiersz ma 4 strategie, ponieważ ma 2 ZBI po dwa ruchy do wyboru. Strategie Pana Wiersza: I. Iść w tym samym kierunku co Kolumna. II. Iść w przeciwnym kierunku niż Kolumna. III. Iść zawsze w prawo. IV. Iść zawsze w lewo. 18 d) Macierz gry WIERSZ I II III IV I -1 0 0 -1 II 2 1 1 2 III -1 1 1 -1 Kolumna IV V 2 -2 0 -1 0 -2 2 -1 VI 4 3 4 3 VII 4 -1 4 -1 VIII -2 3 -2 3 Widzimy zatem, że gra ma dwa punkty siodłowe, a jej wartość wynosi -1. Uzyskaliśmy ten sam wynik co metodą indukcji wstecznej. 19 Rozważając skończoną grę dwuosobową o pełnej informacji, rozgrywaną przez Białych i Czarnych, w której możliwe są tylko dwa wyniki: wygrana Białych lub wygrana Czarnych. Wówczas zawsze zachodzi: o Białe mają strategię wygrywającą, gwarantującą im zwycięstwo niezależnie od tego, jak grać będą Czarne, albo o Czarne mają strategię wygrywającą, gwarantującą im zwycięstwo niezależnie od tego, jak grać będą Białe. 20 Podejmowanie decyzji w warunkach konkurencji W biznesie firmy często podejmują decyzje w warunkach strategicznej niepewności co do działań podejmowanych przez inne, konkurencyjne przedsiębiorstwa. Dodatkowymi czynnikami niepewności mogą być przy tym przyszła koniunktura gospodarcza, wielkość rynku dla nowego produktu, koszty oraz wiele innych zmiennych. Innymi słowy, firmy często biorą udział w grach z udziałem zarówno innych graczy jak i losu. W tego typu grach szczególnego znaczenia nabiera informacja – zarówno dotycząca działań konkurentów, jak i czynników ogólnie określanych jako losowe. 21 Rozważmy przypadek dwóch hipotetycznych firm: Zeus Music: • Lider produkcji nowoczesnego sprzętu audio • Jedna z najlepiej rozpoznawalnych marek Atena Acoustics: • Mniejsza firma • Innowacyjna • Produkująca sprzęt wysokiej jakości Obie firmy opracowały nowy system dźwiękowy. Czynnikiem niepewności jest wielkość rynku na tego typu urządzenie. Może być on mały (potencjalny zysk ok. 24 mln $ rocznie), bądź duży (ok.40mln $ rocznie). Obie firmy muszą zdecydować jakiego typu produkt wypuścić na rynek: • Najwyższej jakości system adresowany do audiofilów • Tańszy system dla klientów o mniejszych wymaganiach jakościowych Biorąc pod uwagę profil obu firm można założyć, że Atena jest lepiej przygotowana do produkcji sprzętu najwyższej jakości natomiast Zeus jako bardziej rozpoznawalna marka do systemu dla większej rzeszy klientów, ale o niższej jakości dźwięku. 22 wypłaty dla (Zeus, Atena) 23 Przeanalizujemy tę grę przyjmując różne założenia w zakresie posiadanych przez graczy informacji. I. Firmy trzymają w tajemnicy swoje decyzje co do wyboru kierunku produkcji. Nie znają także „decyzji” Losu. Wówczas obie firmy mają dwie strategie: Produkować sprzęt najwyższej jakości (NJ), bądź sprzęt tańszy (T). Policzmy oczekiwane wypłaty: np. T-T: 1 2 ∗ 16, 8 + 1 2 30, 10 = (23, 9) 24 Zeus T NJ Atena T NJ (23, 9) (18, 14) (18,14) (20,12) 25 II. Firma Zeus musi podjąć decyzję wcześniej, a Atena może zdecydować na tyle późno, by poznać najpierw decyzję Zeusa. Teraz Atena ma 2 ZBI po dwa ruchy w każdym a co za tym idzie 4 strategie: • Zawsze wybierać T • Zawsze wybierać to samo co Zeus • Zawsze wybierać przeciwnie niż Zeus • Zawsze wybierać NJ Wówczas macierz gry wygląda następująco: T/T Zeus T NJ Atena T/NJ NJ/T 23 23 18 20 NJ/NJ 18 18 18 20 W tej sytuacji wartość gry wynosi 18 dla Zeusa (14 dla Ateny). 26 III. Zeus wykonuje ruch jako pierwszy, ale najpierw przeprowadza badania rynku, które pozwolą mu określić wielkość rynku. Atena nie pozna wyników tych badań, będzie jednak wiedzieć, że takie badania zostały zlecone przez Zeusa. W efekcie Zeus ma teraz także 4 strategie. T/T Zeus T/T T/NJ NJ/T NJ/NJ T/NJ 23 16 25 18 Atena NJ/T 23 20 23 20 NJ/NJ 18 12 24 18 18 16 22 20 27 Zauważmy, że w tej sytuacji zmieniło się: • Optymalna strategia Ateny (z „zawsze wybierać przeciwnie niż Zeus” na „zawsze wybierać NJ” • Zeus opierając swą decyzję na badaniach rynku może powiększyć swoją wypłatę o 4mln. (badania rynku są opłacalne gdy nie kosztują więcej niż 4mln) 28 Teraz strategie Zeusa są uzależnione od tego co „zadecydował” Los. Strategią dominującą jest: „ produkować systemy najwyższej jakości jeśli rynek jest mały, a systemy tańsze jeśli rynek jest duży” Optymalną strategią gry dla Ateny jest „zawsze produkować systemy najwyższej jakości”. Zatem wynik gry to 22(dla Zeusa) i 10 (dla Ateny). 29 Teoria użyteczności Nauka o przypisywaniu liczb do wyników w taki sposób, by liczby te odzwierciedlały preferencje graczy. Jakie właściwości muszą mieć liczby w macierzy wypłat, aby praktyczne zastosowania teorii gier w ogóle miały sens? 30 I. Gra ma punkt siodłowy Wówczas wymagane jest, aby liczby reprezentowały uporządkowanie wyników od najbardziej do najmniej preferowanego wyniku przez Pana Wiersza (odwrotnie do uporządkowania Pani Kolumny) Przykład Pan Wiersz porządkuje swoje wyniki tak: u, w, x, z, y, v. Wtedy aby gra była grą o sumie zerowej uporządkowanie Pani Kolumny musi wyglądać tak: v, y, z, x, w, u. 31 A Pan B Wiersz C Pani Kolumna A B u v w x y z A Pan B Wiersz C Pani Kolumna A B 6 5 2 1 4 3 32 Zauważmy, że gra będzie mieć punkt siodłowy, i to w tym samym miejscu, także wtedy gdy przekształcimy wartości wypłat przez jakąkolwiek funkcję nie zmieniającą ich uporządkowania. Każda taka funkcja zachowuje także wszystkie dominacje. Skalą porządkową – nazywamy skalę, na której większa wartość reprezentuje bardziej preferowany wynik. Znaczenie ma jedynie uporządkowanie wartości. Użytecznościami porządkowymi – nazywamy wartości wyznaczone zgodnie z zasadą preferencji. Pozwalają na wskazywanie punktów siodłowych oraz dominacji. 33 II. Gra nie ma punktu siodłowego Wówczas należy zastosować strategie mieszane. Przykład. Pan A Wiersz B Pani Kolumna A B a b c d różnice d-c a-b Niech a > b i d > c. Wówczas optymalną strategią Pana Wiersza jest strategia mieszana. 𝑑−𝑐 𝑑−𝑐 +(𝑎−𝑏) 𝐴, 𝑎−𝑏 𝑑−𝑐 +(𝑎−𝑏) B 34 Aby miało to sens, wartości wypłat muszą być przypisane wynikom w taki sposób, aby proporcja (𝑑−𝑐) dwóch różnic była interpretowalna. (𝑎−𝑏) Skalą interwałową (przedziałową) nazywamy skalę, przy której można interpretować nie tylko uporządkowanie wartości, ale także proporcje pomiędzy różnicami różnych wartości. Liczby oddające preferencje mierzone w skali interwałowej nazywamy użytecznościami kardynalnymi. Aby rozwiązanie gry w strategiach mieszanych miało sens, liczby wpisane w macierz gry muszą być użytecznościami kardynalnymi. 35