Teoria Decyzji

advertisement
Teoria Decyzji
Wykład 12
N-OSOBOWE GRY KOOPERACYJNE POSTAĆ CHARAKTERYSTYCZNA GRY
Na poprzednich wykładach zajmowaliśmy się głównie takimi sytuacjami, w których
gracze podejmowali decyzje jednocześnie i niezależnie, a wynik gry był wypadkową tych
działań. Współdziałanie czyli kooperację w grach zwykle rozumie się jako zawarcie, jeszcze
przed rozegraniem gry, pewnego porozumienia, które może być potem przestrzegane, albo nie
(w teorii Nasha musi być przestrzegane). O współdziałaniu była już kilkakrotnie mowa np.
przy okazji wytwórców whisky. Gracze — producenci mogli wówczas porozumieć się i
uzyskać znacznie większe zyski niż w przypadku działań nieskoordynowanych. Gry
kooperacyjne dwuosobowe nie są specjalnie ciekawe, gdyż niewielkie są możliwości
tworzenia koalicji. Jako ciekawszy przedstawimy przykład gry trzyosobowej. Opowiadanie
jest następujące.
Trzej muzycy: Skrzypek, Pianista i Basista wylądowali razem w dalekim kraju za
oceanem. Po wyspaniu się i zjedzeniu śniadania wyszli rozejrzeć się za pracą. Gdy spotkali
się wieczorem okazało się, że stoją przed nimi następujące możliwości. Mogą występować
razem w pewnym klubie nocnym i za jeden występ otrzymają łącznie 200 dolarów. Okazuje
się też, że gdyby w innym klubie występowali tylko Skrzypek z Pianistą, to zarobiliby 160
dolarów, natomiast Pianista i Basista mogliby zarobić we dwóch 130 dolarów. W sąsiednim
klubie Basista ze Skrzypkiem mogą liczyć na zarobek w wysokości 100 dolarów, a sam
Pianista dostałby za występ 60 dolarów. Jeszcze inny klub zatrudniłby Skrzypka samego i
skłonny byłby zapłacić mu 40 dolarów. Tylko Perkusisty solo nikt nie chce zatrudnić.
Tak opisaną grę kooperacyjną możemy przedstawić w formie przedstawionej w
poniższej tabeli.
Koalicja
Wypłata
{Skrzypek, Pianista, Basista}
200
{ Pianista, Basista}
130
{Skrzypek,Basista}
100
{Skrzypek, Pianista}
160
{Skrzypek}
40
{ Pianista}
60
{ Basista}
0
Taka tabela to tzw. postać charakterystyczna gry kooperacyjnej.
Formalnie taką postać gry definiuje się opisując:
zbiór wszystkich graczy G = {Pl, P2, .... Pn},
zbiór wszystkich koalicji, tzn wszystkich podzbiorów zbioru graczy (całe G i
zbiory złożone z jednego tylko gracza też są koalicjami)
przyporządkowanie każdej koalicji K
jakiejś liczby v(K), która opisuje
możliwości tej koalicji.
Pewnego komentarza wymaga wartość v(K) przypisana koalicji K (zwana wartością koalicji).
Można wyobrażać sobie, że jest to wypłata którą jest wstanie koalicja sobie wypracować. Ale
uwaga – trzeba dla dalszych rozważań założyć, że tak jak w naszym przykładzie wypłata ta
realizowana jest w pewnych jednostkach, które dadzą się między graczami wymieniać i tyle
samo dla nich znaczą! Możliwa jest do sformułowania teoria, w której wypłaty są wyrażane w
funkcjach użyteczności właściwych dla każdego z graczy z osobna i nieporównywalnych
między nimi, ale byłoby to zbyt skomplikowane jak na możliwości naszego wykładu.
Wróćmy zatem do naszego przykładu. Aby zadość uczynić postulatowi wymienialności
wypłat zakładamy, że decydującą kwestią jest zarobek (i, co sugeruje przykład , gracze mają
analogiczna funkcje użyteczności pieniądza). Świadomie w tym miejscu pomijamy sprawy
związane z chęcią występowania przed publicznością, pomocy kolegom, bezinteresownością
itp. Gdyby zostały one uwzględnione w wypłatach, to już pojawiłby się wspomniany przed
chwilą kłopot związany z międzyosobowym transferem użyteczności. Zostawmy to teraz,
wszak nie o to w tej chwili chodzi, by zbudować właściwy model konkretnej sytuacji, ale na
odwrót – by pewna wyimaginowana konkretna sytuacja była modelem pewnych koncepcji
pojawiających się na gruncie teorii decyzji.
Zatem w jaki sposób muzycy
rozstrzygną kwestię swojego zatrudnienia i
indywidualnego wynagrodzenia?
Po pierwsze zauważmy, że nasza gra ma pewną naturalną własność, która nazywa się
superaddytywnosią : każdych dwóch muzyków razem zarobi więcej niż zarobiliby łącznie,
ale występując osobno. Tak samo, każdej koalicji złożonej z dwóch muzyków i pozostałemu
trzeciemu artyście bardziej opłaci się wystąpić w pełnym składzie. Zatem największą masę
pieniędzy dostaną w największej koalicji. W przypadku
takich gier (tj. posiadających
własność superaddytywności) nie ulega więc wątpliwości, że największa koalicja jest
najbardziej opłacalna. Pozostaje jeszcze kwestia podziału zarobionych pieniędzy w ramach
takiej koalicji. Jak to zrobić?
Formalnie taki podział tworzą trzy liczby Xs, Xp oraz Xb dające w sumie 200. Można
się spodziewać, że żaden muzyk nie zgodzi się przyjąć wypłaty niższej, niż kwota, jaką
mógłby sam zarobić. Otrzymujemy więc warunki indywidualnej racjonalności:
Xs ≥ 50
Xp ≥ 60
Xb ≥ 0
Weźmy teraz pod uwagę dalsze ograniczenia nazywane warunkami koalicyjnej
racjonalności.
Xs+Xp ≥ 160
Xb+Xp ≥ 130
Xs+Xb ≥ 100
Warunki te mówią tyle, że żadna koalicja nie zgodzi się na podział, przy którym suma
kwot przypadających członkom tej koalicji będzie niższa niż kwota, jaką taka koalicja
mogłaby sama zarobić. Mówimy też w takiej sytuacji, że dana koalicja, na przykład
{Skrzypek, Pianista}, dla której podział (Xs, Xp, Xb) dawałby Xs+Xp<160, kwestionowałaby
taki podział – mogłaby przecież oddzielić się z całości i sama wypracowałaby dla siebie
Xs+Xp=160.
Przekształcając
wszystkie
powyższe
nierówności,
możemy
teraz
scharakteryzować podziały koalicyjnie racjonalne. Ale z tych ograniczeń wynikają dalsze!
Okazuje się np. że , wbrew temu co mogłoby się naiwnie wydawać, Basista może żądać dla
siebie znacznie więcej niż zero! Na pewno nie otrzyma mniej niż 30! Wynika to z tego, że
skrzypek nie może dla siebie żądać więcej niż 70 (bo wtedy Xb+Xp < 130)
pianista nie może dla siebie żądać więcej niż 100 (bo wtedy Xs+Xb < 100)
ale zatem Basista dostanie co najmniej 130-100 lub 100-70 (wartości kolacji
dwuosobowych z perkusistą minus potencjalnie największe wymagania
drugiego z muzyków)
Oczywiście Basista nie może liczyć na więcej niż 200 – 160 (tj całość pieniędzy minus
gwarantowana wypłata dla duetu Pianisty ze Skrzypkiem).
Analogiczne rozumowanie można przeprowadzić dla pozostałych muzyków.
Ostatecznie wszystkie podziały spełniające warunki racjonalności koalicyjnej i indywidualnej
muszą spełniać następujące warunki:
Suma kwot uzyskanych łącznie przez trzech muzyków wyniesie 200 dolarów.
Kwota Xs uzyskana przez Skrzypka nie będzie niższa od 60 dolarów, ani
wyższa od 70 dolarów.
Kwota Xp uzyskana przez Pianistę nie będzie niższa od 90 dolarów, ani
wyższa od 100 dolarów.
Łącznie Skrzypek i Pianista dostaną co najmniej 160 dolarów. Reszta
przypadnie Perkusiście — jak pokazaliśmy będzie to kwota Xb między 30 a 40
dolarów.
Warunki te pozwalają na dosyć dokładne określenie spodziewanego podziału, dla
każdego muzyka z dokładnością do 10 dolarów.
W tych ramach trudno już cokolwiek graczom zaproponować na podstawie samych
reguł gry. Sytuacja przypomina tę z kooperacyjnych gier dwuosobowych - pamiętamy, że
gracze powinni wybrać strategie prowadzące do wypłaty ze zbioru negocjacji, ale do której z
nich – teoria nie mówi. Dopiero odwołanie się do pewnych poza growych argumentów takich jak np. sprawiedliwość – doprowadziło do propozycji rozwiązania arbitrażowego
(rozwiązanie problemu targu w sensie Nasha). W grach n-osobowych zaproponujemy
postępowanie analogiczne. Ale zanim się tym zajmiemy (na następnym wykładzie) omówimy
kilka innych ważnych kwestii związanych z różnymi koncepcjami rozwiązania gry
kooperacyjnej.
Zbiór wszystkich koalicyjnie racjonalnych podziałów, czyli takich, których nie
zakwestionuje żadna koalicja, nazywa się rdzeniem gry. Jest to pojęcie intuicyjnie bardzo
oczywiste. Można by spodziewać się, że podziały należące do rdzenia będą stanowić
sensowne „rozwiązanie" każdej gry. Niestety tak nie jest. Okazuje się, że w wielu grach w
ogóle nie ma żadnego podziału koalicyjnie racjonalnego! Co zrobić w takim wypadku? Tą
sprawą zajmiemy się w następnych częściach wykładu.
Zbiór stabilny
W poprzedniej części mówiliśmy o grze kooperacyjnej dotyczącej muzyków
szukających pracy w obcym kraju. Rozpatrzmy następny przykład związane z emigrantami
niewykwalifikowanymi.
Trzech kolegów, Zyga, Wiesiek i Mietek, poszukuje pracy. W okolicy jest tylko jedna
oferta pracy. Praca ma polegać na przenoszeniu długich i ciężkich skrzyń i jest płatna 100
dolarów za dniówkę dla całej ekipy. Jest to robota którą może wykonać dwóch pracowników:
jeden bierze jeden koniec skrzyni, drugi za drugi, i niosą. Jeden robotnik sobie z tym nie
poradzi, a trzeci jest po prostu niepotrzebny. Dla tej gry otrzymujemy następującą postać
charakterystyczną:
Koalicja
{ Zyga, Wiesiek, Mietek }
{ Wiesiek, Mietek }
{ Zyga, Mietek }
{ Zyga, Wiesiek }
{ Mietek }
{ Zyga, }
{ Wiesiek }
Wypłata
100
100
100
100
0
0
0
Jak gracze podzielą między siebie 100 dolaró ? Okazuje się, że warunki opisane w
poprzednim rozdziale do niczego nas nie doprowadzą. Każdy koalicyjnie racjonalny podział
(Xz, Xw, Xm) musiałby spełniać warunki:
Xz +Xw+ Xm=100
Xz+ Xm ≥ 100
Xz+ Xw ≥ 100
Xw+ Xm ≥ 100
Xz ≥ 0, Xw ≥ 0, Xm ≥ 0
Niestety wypisane wyżej warunki są sprzeczne: w ogóle nie ma takiego układu liczb
Xz, Xw, Xm, który by je spełniał, a więc każdy zaproponowany podział będzie przez jakąś
koalicję zakwestionowany. Na przykład podział (40; 40; 20) zostanie zakwestionowany przez
każdą koalicję dwuosobową: obaj gracze mogą zarobić więcej (czyli 100) niż suma
zaproponowanych im wypłat przy takim podziale (60 lub 80).
Co można więc zrobić w takiej sytuacji? Pewne rozwiązanie zaproponowali John von
Neumann i Oskar Morgenstern już w 1944 roku. Rozwiązanie to opiera się o pojęcie
dominacji. Mówimy, że w grze kooperacyjnej n-osobowej podział (X1, X2, ... , Xn) jest
zdominowany przez podział (Y1, Y2, ... , Yn), gdy istnieje taka koalicja K, dla której
spełnione są dwa warunki:
• koalicja K jest w stanie sama „wypracować" podział (Y1, Y2, ...
, Yn), tzn.
formalnie, suma wypłat graczy z koalicji K przy podziale y (czyli suma wszystkich liczb Yi
takich, że i K) nie przekracza liczby v(K) opisującej możliwości tej koalicji, oraz
• przy podziale (Y1, Y2, ... , Yn) kwota przypadająca każdemu graczowi należącemu
do koalicji K jest większa niż kwota przypadająca mu przy podziale (X1, X2, ... , Xn) , tzn.
Yi>Xi dla wszystkich i takich, że i K)
Na przykład podział (40; 40; 20) w naszej grze jest zdominowany przez podział (50;
50; 0), a dzieje się tak za sprawą koalicji złożonej z dwóch pierwszych graczy: Zyga i
Wiesiek umawiają się, że to właśnie oni podejmą pracę, zarobią 100 złotych i podzielą się po
połowie, co da im wyższe wypłaty, niż proponowane 40 złotych. Podziały koalicyjnie
racjonalne, które badaliśmy w poprzednim rozdziale, to z definicji takie podziały, które nie są
zdominowane przez żaden inny podział. Skoro jednak w naszej grze nie ma takich podziałów,
więc spróbujemy, posługując się pojęciem dominacji, skonstruować jakieś inne pojęcie
„rozwiązania" gry. Nie będzie to jeden konkretny podział, ale pewien zbiór podziałów. W
określonej sytuacji społecznej można się spodziewać, że konkretny podział, jaki nastąpi,
będzie elementem tego zbioru.
Formalnie zbiór stabilny (czasem nazywany też rozwiązaniem von NeumannaMorgensterna) definiuje się jako dowolny zbiór podziałów S, który spełnia dwa warunki:
• jest wewnętrznie stabilny, to znaczy żaden podział, który należy do S nie dominuje
żadnego innego podziału z S, oraz
• jest zewnętrznie stabilny w tym sensie, że każdy podział, który nie należy do S jest
zdominowany przez jakiś podział należący do S.
Zilustrujmy to pojęcie na konkretnym przykładzie w naszej grze. Weźmy pod uwagę
zbiór S* złożony z trzech podziałów
(50; 50; 0), (50; 0; 50), (0; 50; 50),
a więc ze wszystkich takich podziałów, przy których dwaj gracze dogadują się, biorą całą
wypłatę, dzielą się nią po połowie, a trzeciemu graczowi nie dają nic. Można sprawdzić, że
ten zbiór jest wewnętrznie i zewnętrznie stabilny: żaden z tych trzech podziałów nie dominuje
żadnego z pozostałych, natomiast każdy podział, który nie jest takiej postaci jest
zdominowany przez jeden z tych trzech podziałów. Zbiór S* jest więc stabilny.
Taka koncepcja rozwiązania to odpowiada pewnym znanym sytuacjom społecznym i
może być interpretowana jako opis pewnej normy zachowania. Tą normą jest: postępować w
sposób bezwzględny, za wszelką cenę próbować się z kimś dogadać nie licząc się z losem
trzeciego gracza, który nie zostanie dopuszczony do umowy. Nie wiemy, jaki podział
faktycznie nastąpi, ale na pewno będzie to jeden z trzech podziałów wyliczonych powyżej.
Oczywiście – wracamy znowu do naszych rozważań związanych z modelowaniem sytuacji
decyzyjnych – problemu tego rodzaju można by uniknąć rozważając wypłaty w
użytecznościach graczy, te mogłyby uwzględniać społeczne normy
i, ewentualne,
zachowania altruistyczne (jak w problemie architekt-kreślarz). Jednak przy rozważaniach
gier n-osobowych koalicyjnych, ze względu na znaczną pojęciową i formalną komplikację
problemu, z takiej interpretacji wypłat zrezygnowaliśmy – zatem w tym przypadku
ewentualny kłopot z akceptacją zachowań bezwzględnych pozostaje.
Wracamy do naszej analizy możliwych rozwiązań. Jedna gra może mieć wiele
różnych zbiorów stabilnych i każdy z nich jest interpretowany jako jakaś norma postępowania
społecznego. Podobnie jest i w przypadku naszej gry. Znaleziony zbiór stabilny nie jest
jedyny, tak jak opisany schemat postępowania nie jest jedyną normą. Przedstawimy jeszcze
dwa przykłady zbiorów stabilnych w naszej grze.
Przypuśćmy, że wszyscy gracze to ludzie porządni, którzy nikogo nie chcą
skrzywdzić, ale z jakichś względów Wiesiek i Mietek uważają Zygę za nieudacznika, który
nie bardzo nadaje się do pracy. W takim społeczeństwie normy postępowania może opisywać
zbiór S0 wszystkich podziałów postaci (20; b; c) gdzie b i c są dowolnymi liczbami
nieujemnymi dającymi w sumie 80. W tym społeczeństwie obowiązuje więc następująca
norma: Zyga to „jednostka słaba, która do pracy się nie nadaje", my jesteśmy porządni, więc
damy mu 20 dolarów, ale pracować chcemy sami i resztą, czyli 80 złotymi podzielimy się, jak
nam się będzie chciało.
Gdyby to Mietek był uważany za nieudacznika, a Zyga z Wiesiekem byli trochę mniej
szczodrzy niż przedtem Wiesiek i Mietek, to tej sytuacji odpowiadałby zbiór stabilny S0
złożony ze wszystkich podziałów postaci {a, b, 10) gdzie a i b są dowolnymi liczbami
nieujemnymi dającymi w sumie 90.
W odróżnieniu od podziałów koalicyjnie racjonalnych, których często w ogóle nie ma,
zbiorów stabilnych jest zwykle wiele (w naszej grze jest ich nawet nieskończenie wiele).
Przez długi czas nie wiedziano, czy są w ogóle takie gry, które nie mają żadnego zbioru
stabilnego. Po wielu latach Lucas skonstruował taką grę dziesięcioosobową w 1969 roku, ale
do tej pory nie znaleziono dla niej żadnej naturalnej „życiowej" interpretacji. Von Neumann i
Morgenstern spodziewali się, że zbiór stabilny, pojęcie w naturalny sposób oddające intuicje i
odegra wielką rolę w badaniach ekonomicznych. Do dzisiaj tak się jednak nie stało. Zbiór
stabilny jest pojęciem funkcjonującym raczej na obrzeżach teorii gier i jej zastosowań. Jest
pojęciem ciągle słabo zbadanym, może ze względu na konieczność stosowania żmudnych i
nieefektownych środków matematycznych. Wielu fachowców uważa jednak, że teraz nastąpi
powrót do zbiorów stabilnych.
Download