Niepewnosc w teorii gier

advertisement
Niepewność w teorii gier
Paweł Najgebauer
28-01-2008
1
Gra bayesowska
W teorii gier spotykamy si˛e cz˛esto z mechanizmami, w których nieznane sa˛ do-
kładne informacje na temat preferencji graczy a także macierzy wypłat. Takie mechanizmy nazywa si˛e grami bayesowskimi. Laureat nagrody Nobla w dziedzinie ekonomii
z 1994 roku, John Harsanyi, zaproponował wprowadzenie Natury jako dodatkowego
gracza w celu zamodelowania niepewności. Natura losowo przypisuje każdemu z graczy pewien typ, który do pewnego stopnia determinuje jego zachowanie w grze (uściślajac,
˛ determinuje jego funkcj˛e wypłat). Ów typ jest zmienna˛ losowa,˛ której rozkład
jest dany. W grze bayesowskiej niekompletność informacji oznacza, że przynajmniej
jeden z graczy nie jest pewien jakiego typu sa˛ inni gracze.
Gracze na poczatku
˛
gry maja˛ pewne wyobrażenia na temat typów pozostałych
uczestników, przy czym nie posiadajac
˛ żadnych przesłanek, gracze musza˛ si˛e oprzeć
o dany rozkład możliwych typów. W czasie gry, gdy zaobserwowane zostana˛ decyzje podj˛ete przez uczestników, owe wyobrażenia moga˛ być uaktualniane za pomoca˛
twierdzenia Bayesa (stad
˛ nazwa tego typu gier).
1.1
Specyfikacja gry
W grach niebayesowskich z pełna˛ informacja˛ mamy do dyspozycji przestrzeń do-
puszczalnych strategii i funkcje wypłat graczy. Wówczas strategia danego gracza jest
kompletnym planem działań zabezpieczajacym
˛
każda˛ ewentualność. Funkcja wypłat
jest funkcja˛ przekształcajac
˛ a˛ zbiór strategii na zbiór wypłat (np. typu rzeczywistego).
W grach bayesowskich należy zdefiniować również przestrzeń możliwych typów
graczy i ich wyobrażeń na temat innych. W takiej sytuacji strategia˛ gracza jest zbiorem
planów działań gracza dla każdego typu, który może go dotyczyć. Macierz przekonań
1
wzgl˛edem pozostałych graczy wyraża jego niepewność wobec ich typów, pod warunkiem posiadania danego typu. Każde takie przekonanie jest prawdopodobieństwem
warunkowym, wyrażajacym
˛
si˛e wzorem: p(typyP ozostaychGraczy|typGracza).
Funkcja wypłat jest funkcja˛ dwóch zmiennych U (x∗ , t), gdzie x∗ jest strategia˛ w danej
grze a t jego typem.
1.2
Punkt równowagi Bayesa-Nasha
W grach niebayesowskich profil strategii graczy (macierz strategii) jest punktem
równowagi Nasha, jeśli każda strategia w tym profilu jest najlepsza˛ odpowiedzia˛ na
dowolne działanie pozostałych graczy, tzn. nie ma takiej strategii, która przyniosłaby
lepszy (w sensie Pareto) rezultat, majac
˛ dane strategie grane przez pozostałych graczy. W grach z niepełna˛ informacja,˛ gdzie modeluje si˛e uczestników jako neutralnych
wzgl˛edem ryzyka, gracze maksymalizuja˛ oczekiwana˛ wartość wypłaty, majac
˛ dane
wyobrażenia nt. typów pozostałych graczy. W ogólnym przypadku, gdzie uczestnicy
moga˛ być bardziej lub mniej skłonni do podejmowania ryzyka, zakłada si˛e, że gracze
maksymalizuja˛ wartość oczekiwana˛ funkcji użyteczności (średniej wypłaty ważonej
preferencjami). Punkt równowagi Bayesa-Nasha definiuje si˛e jako profil strategii i
przekonań odnośnie typów pozostałych graczy, który maksymalizuje wartość oczekiwana˛ wypłat każdego z graczy, pod warunkiem ich przekonań i profili strategii granych
przez pozostałych. Takie rozwiazanie
˛
prowadzi do pojawienia si˛e wielu punktów równowagi, co uniemożliwia precyzyjna˛ analiz˛e gier z niepełna˛ informacja.˛
1.3
Doskonała równowaga Bayesa
Koncepcja punktu równowagi Bayesa-Nasha daje mało prawdopodobne rezultaty
w przypadku gier sekwencyjnych, w których gracze podejmuja˛ decyzje naprzemiennie
(w przeciwieństwie do symultanicznych, w których gracze podejmuja˛ decyzje jednocześnie). Aby wybrać odpowiednie punkty równowagi spośród znalezionych przez
powyższa˛ metod˛e wprowadza si˛e poj˛ecie doskonałej równowagi Bayesa, które zakłada
lokalna˛ optymalizacj˛e (w obr˛ebie, powiedzmy, jednej decyzji).
1.4
Przykład
Informacja w grze (rysunek 1) jest niepełna jeśli gracz 2 nie wie jaka˛ decyzj˛e podjał
˛
gracz 1. Jeśli obydwaj gracze sa˛ racjonalni i wiedza˛ wzajemnie o tym (gracz 1 wie,
że gracz 2 jest racjonalny i gracz 2 wie o tym, że gracz 1 to wie, itd.), gra przebiegnie
2
Rysunek 1: Drzewo decyzyjne
nast˛epujaco:
˛
Gracz 1 wybierajac
˛ decyzj˛e U nie ma szans przegrać, jednak bardziej
kuszace
˛ dla niego może być zaryzykowanie decyzji D i liczenie na decyzj˛e D’ gracza
2. W tym trywialnym przypadku oczywiście gracz 2 z dużym prawdopodobieństwem
podejmie decyzj˛e U’, i właśnie taki profil strategii jest punktem doskonałej równowagi
Bayesa (w przypadku pełnej informacji ten punkt byłby punktem równowagi Nasha).
2
Gra stochastyczna
Innym typem gier, w których modeluje si˛e niepewność sa˛ tzw. gry stochastyczne.
Sa˛ to gry podzielone na etapy, w których definiuje si˛e przestrzeń stanów gry, od których zależa˛ funkcje wypłat graczy. Przejścia pomi˛edzy stanami odbywaja˛ si˛e po każdej
sekwencji decyzji graczy. Stan wyjściowy jest zmienna˛ losowa,˛ której rozkład zależy
od stanu wejściowego i decyzji podj˛etych przez graczy na danym etapie. Procedura
powtarza si˛e pewna˛ ilość razy (lub nigdy si˛e nie kończy) a wypłata graczy jest suma˛
(lub średnia)
˛ wypłat z poszczególnych etapów gry. Jeśli ilość graczy, przestrzeń decyzji i stanów sa˛ skończone, gra stochastyczna posiada punkt równowagi Nasha. Gry
stochastyczne maja˛ zastosowanie w ekonomii i w biologii (ewolucja).
3
Download