Niepewność w teorii gier Paweł Najgebauer 28-01-2008 1 Gra bayesowska W teorii gier spotykamy si˛e cz˛esto z mechanizmami, w których nieznane sa˛ do- kładne informacje na temat preferencji graczy a także macierzy wypłat. Takie mechanizmy nazywa si˛e grami bayesowskimi. Laureat nagrody Nobla w dziedzinie ekonomii z 1994 roku, John Harsanyi, zaproponował wprowadzenie Natury jako dodatkowego gracza w celu zamodelowania niepewności. Natura losowo przypisuje każdemu z graczy pewien typ, który do pewnego stopnia determinuje jego zachowanie w grze (uściślajac, ˛ determinuje jego funkcj˛e wypłat). Ów typ jest zmienna˛ losowa,˛ której rozkład jest dany. W grze bayesowskiej niekompletność informacji oznacza, że przynajmniej jeden z graczy nie jest pewien jakiego typu sa˛ inni gracze. Gracze na poczatku ˛ gry maja˛ pewne wyobrażenia na temat typów pozostałych uczestników, przy czym nie posiadajac ˛ żadnych przesłanek, gracze musza˛ si˛e oprzeć o dany rozkład możliwych typów. W czasie gry, gdy zaobserwowane zostana˛ decyzje podj˛ete przez uczestników, owe wyobrażenia moga˛ być uaktualniane za pomoca˛ twierdzenia Bayesa (stad ˛ nazwa tego typu gier). 1.1 Specyfikacja gry W grach niebayesowskich z pełna˛ informacja˛ mamy do dyspozycji przestrzeń do- puszczalnych strategii i funkcje wypłat graczy. Wówczas strategia danego gracza jest kompletnym planem działań zabezpieczajacym ˛ każda˛ ewentualność. Funkcja wypłat jest funkcja˛ przekształcajac ˛ a˛ zbiór strategii na zbiór wypłat (np. typu rzeczywistego). W grach bayesowskich należy zdefiniować również przestrzeń możliwych typów graczy i ich wyobrażeń na temat innych. W takiej sytuacji strategia˛ gracza jest zbiorem planów działań gracza dla każdego typu, który może go dotyczyć. Macierz przekonań 1 wzgl˛edem pozostałych graczy wyraża jego niepewność wobec ich typów, pod warunkiem posiadania danego typu. Każde takie przekonanie jest prawdopodobieństwem warunkowym, wyrażajacym ˛ si˛e wzorem: p(typyP ozostaychGraczy|typGracza). Funkcja wypłat jest funkcja˛ dwóch zmiennych U (x∗ , t), gdzie x∗ jest strategia˛ w danej grze a t jego typem. 1.2 Punkt równowagi Bayesa-Nasha W grach niebayesowskich profil strategii graczy (macierz strategii) jest punktem równowagi Nasha, jeśli każda strategia w tym profilu jest najlepsza˛ odpowiedzia˛ na dowolne działanie pozostałych graczy, tzn. nie ma takiej strategii, która przyniosłaby lepszy (w sensie Pareto) rezultat, majac ˛ dane strategie grane przez pozostałych graczy. W grach z niepełna˛ informacja,˛ gdzie modeluje si˛e uczestników jako neutralnych wzgl˛edem ryzyka, gracze maksymalizuja˛ oczekiwana˛ wartość wypłaty, majac ˛ dane wyobrażenia nt. typów pozostałych graczy. W ogólnym przypadku, gdzie uczestnicy moga˛ być bardziej lub mniej skłonni do podejmowania ryzyka, zakłada si˛e, że gracze maksymalizuja˛ wartość oczekiwana˛ funkcji użyteczności (średniej wypłaty ważonej preferencjami). Punkt równowagi Bayesa-Nasha definiuje si˛e jako profil strategii i przekonań odnośnie typów pozostałych graczy, który maksymalizuje wartość oczekiwana˛ wypłat każdego z graczy, pod warunkiem ich przekonań i profili strategii granych przez pozostałych. Takie rozwiazanie ˛ prowadzi do pojawienia si˛e wielu punktów równowagi, co uniemożliwia precyzyjna˛ analiz˛e gier z niepełna˛ informacja.˛ 1.3 Doskonała równowaga Bayesa Koncepcja punktu równowagi Bayesa-Nasha daje mało prawdopodobne rezultaty w przypadku gier sekwencyjnych, w których gracze podejmuja˛ decyzje naprzemiennie (w przeciwieństwie do symultanicznych, w których gracze podejmuja˛ decyzje jednocześnie). Aby wybrać odpowiednie punkty równowagi spośród znalezionych przez powyższa˛ metod˛e wprowadza si˛e poj˛ecie doskonałej równowagi Bayesa, które zakłada lokalna˛ optymalizacj˛e (w obr˛ebie, powiedzmy, jednej decyzji). 1.4 Przykład Informacja w grze (rysunek 1) jest niepełna jeśli gracz 2 nie wie jaka˛ decyzj˛e podjał ˛ gracz 1. Jeśli obydwaj gracze sa˛ racjonalni i wiedza˛ wzajemnie o tym (gracz 1 wie, że gracz 2 jest racjonalny i gracz 2 wie o tym, że gracz 1 to wie, itd.), gra przebiegnie 2 Rysunek 1: Drzewo decyzyjne nast˛epujaco: ˛ Gracz 1 wybierajac ˛ decyzj˛e U nie ma szans przegrać, jednak bardziej kuszace ˛ dla niego może być zaryzykowanie decyzji D i liczenie na decyzj˛e D’ gracza 2. W tym trywialnym przypadku oczywiście gracz 2 z dużym prawdopodobieństwem podejmie decyzj˛e U’, i właśnie taki profil strategii jest punktem doskonałej równowagi Bayesa (w przypadku pełnej informacji ten punkt byłby punktem równowagi Nasha). 2 Gra stochastyczna Innym typem gier, w których modeluje si˛e niepewność sa˛ tzw. gry stochastyczne. Sa˛ to gry podzielone na etapy, w których definiuje si˛e przestrzeń stanów gry, od których zależa˛ funkcje wypłat graczy. Przejścia pomi˛edzy stanami odbywaja˛ si˛e po każdej sekwencji decyzji graczy. Stan wyjściowy jest zmienna˛ losowa,˛ której rozkład zależy od stanu wejściowego i decyzji podj˛etych przez graczy na danym etapie. Procedura powtarza si˛e pewna˛ ilość razy (lub nigdy si˛e nie kończy) a wypłata graczy jest suma˛ (lub średnia) ˛ wypłat z poszczególnych etapów gry. Jeśli ilość graczy, przestrzeń decyzji i stanów sa˛ skończone, gra stochastyczna posiada punkt równowagi Nasha. Gry stochastyczne maja˛ zastosowanie w ekonomii i w biologii (ewolucja). 3