Dylemat więźnia jako przykład wykorzystania teorii gier

advertisement
Paulina Nogal*
Dylemat więźnia jako przykład
wykorzystania teorii gier
Wstęp
Na skutek postępu technologicznego, rozwoju nowych możliwości
komunikowania się, przesyłania informacji na odległość, przewidywanie przyszłości zaczyna przypominać wróżenie z fusów. Prędkość obiegu informacji staje się tak duża, że opracowanie długofalowej, wiarygodnej strategii dla firmy staje się coraz trudniejszym wyzwaniem.
Przedsiębiorcy z długoletnim stażem na rynku nabierają doświadczenia
w tej ekstremalnej sztuce1, początkujący natomiast zdają się na łut szczęścia, który w grach hazardowych określany jest jako beginners luck.
Na czym więc oprzeć wnioskowanie i co brać po uwagę, a także jak
oceniać swoich przeciwników, skoro niczego już nie można być pewnym? W tej sytuacji pomocne może okazać się wykorzystanie matematycznych narzędzi oraz mikroekonomicznych założeń, a dokładniej –
skorzystanie z aparatu „obliczeniowego” jaki daje teoria gier. Podstawowe modele zakładają, że osoby, które znalazły się w konfliktowej sytuacji, rozwiążą ją za pomocą logicznego myślenia, a w szczególności za
pomocą racjonalności i użyteczności. Problem polega w tym, że nie dla
każdego racjonalność oznacza to samo, a tym bardziej każdy człowiek
może maksymalizować użyteczność przy osiąganiu innych wartości.
Prekursorzy mikroekonomii zdawali się jednak nie przejmować tymi
ograniczeniami, gdyż „siła modelu wynika właśnie z wyeliminowania
informacji mających niewielkie znaczenie, co pozwala ekonomiście skupić się na zasadniczych, istotnych cechach rzeczywistości ekonomicznej,
którą usiłuje zrozumieć” [Varian, 2005, s. 31].
Celem artykułu jest przedstawienie modelu równowagi Nasha na
przykładzie gier niekooperatywnych o charakterze niepowtarzalnym
oraz możliwości ich zastosowania w życiu gospodarczym. Głównym
założeniem w tym przypadku jest racjonalne postępowanie jednostek,
Mgr, Katedra Ekonomiki Przedsiębiorstw, Wydział Zarządzania, Uniwersytet Gdański,
[email protected], ul. Armii Krajowej 101, 81-824 Sopot
1 Nie jest to oczywiście reguła, a jedynie uogólnienie. Vide Nokia.
*
88
Paulina Nogal
dzięki któremu optymalizują one swoje położenie pod względem ekonomicznym.
W artykule została zastosowana metoda dedukcji wspomagana metodą deskryptywną.
1. O racjonalności i maksymalizowaniu użyteczności
Teoria gier, mimo, iż jej właściwym miejscem jest matematyka, to
jest głęboko zakorzeniona w mikroekonomicznych aspektach rzeczywistości gospodarczej. Ekonomiści są raczej zgodni co do faktu, że za
pierwszy model tego rodzaju można przyjąć model równowagi Cournota (opublikowany w 1838 r.). Nie brakuje jednak opinii, że elementy teorii gier można znaleźć już u Arystotelesa – w szczególności w konfliktach politycznych. W związku z tym, że strategie rozpatrywane w grach
są niczym innym jak tylko przedstawieniem sytuacji konfliktowych2
jakie zdarzają się jednostkom nie dziwi zatem fakt, że towarzyszyły
człowiekowi w zasadzie od zawsze. Kwestią tylko było metodologiczne
wyprowadzenie tych teorii w matematyce tak, aby uzyskać możliwość
ich stosowania w ekonomii, psychologii czy nawet biologii3.
Pierwszym, fundamentalnym założeniem, jeśli chodzi o analizę
zachowań mikroekonomicznych, jest przyjęcie, że człowiek zachowuje
się w sposób racjonalny. Przyjmuje się wobec tego, że człowiek zastanawia się nad swoim zachowaniem, kalkulując przy tym, co mu się bardziej opłaca nie tylko w sensie ekonomicznym, ale również w ramach
szeroko pojętej użyteczności. Co więcej, człowiek dokonuje wyborów
swoich decyzji na podstawie zachowań innych ludzi, czyli analizuje
wzajemną i końcową wartość ekonomiczną w wyniku danej interakcji.
Racjonalność rozpatrywana w kwestiach etymologicznych opiera
się na założeniu, że człowiek aktywnie wykorzystuje rozum w sensie
obliczeniowo-kalkulacyjnym. W ramach analizy mikroekonomicznej
mamy do czynienia z dokładnie takim samym zachowaniem. Jest ono
jedynie doprecyzowane w ten sposób, że jednostki (podmioty) działające na rynku w pierwszej kolejności muszą określić cel prowadzenia
działalności, a następnie, rozważając ograniczone zasoby, minimalizować koszty (produkcja = constans) lub maksymalizować produkcję
(koszty = constans).
Bardziej precyzyjnym określeniem byłoby opisanie teorii gier jako szukanie optymalnego zachowania się jednostek w przypadku konfliktu interesów.
3 [Malawski, 1997]
2
Dylemat więźnia jako przykład wykorzystania teorii gier
89
Szeroko pojęta racjonalność została podzielona w mikroekonomii
na dwa standardy. Pierwszy z nich opiera się na zasadach celu, drugi –
na korzyści własnej [Frank, 2007, s. 261]. Przy czym ani o jednym ani o
drugim nie można powiedzieć, że jest w pełni wiarygodny. Racjonalność oparta na celu pomija bowiem analizę celu pod względem jego celowości. Jakkolwiek dziwnie to brzmi nie jest jednak pozbawione sensu.
Cel celu człowieka nie ma w tym wypadku żadnego znaczenia. Oznacza
to, że osoba posiadająca preferencje autodestrukcyjne będzie analizowana z punktu widzenia skuteczności realizowania swoich autodestrukcyjnych zachowań. Powinna zatem zachowywać się w sposób autodestrukcyjny możliwie jak najbardziej skutecznie. Z kolei rozpatrując racjonalność z punktu widzenia tylko i wyłącznie własnej korzyści należałoby dojść do wniosku, że homo oeconomicus, to nic innego jak przypadek
człowieka bezwzględnie egoistycznego, który całą swoją uwagę skupia
na maksymalizowaniu efektywności ekonomicznej własnej egzystencji.
Tym samym postawa altruistyczna, trzymanie się zasad czy pragnienie
sprawiedliwości są mu zupełnie obce.
W zakresie użyteczności, ciekawe stwierdzenie sformułowali
Jevons, Menger i Walras. Twierdzili oni bowiem, że wysokie koszty,
które zostały poniesione dla wytworzenia danego dobra czy usługi nie
koniecznie muszą prowadzić do wysokiej ceny. Teoria użyteczności
krańcowej wskazuje, że dla konsumenta czy też innego podmiotu działającego z danym przedsiębiorstwem, cena danego dobra czy też usługi
zależy od tego jaki poziom użyteczności przedstawia dana rzecz dla danej osoby. Oznacza to, że użyteczność „bierze swój początek nie z przeszłości, lecz z przyszłości” [Landreth, Colander, 2005, s. 240]. Takie podejście pokazuje, jak dalece określone zachowanie może być pozbawione racjonalności, kiedy oparte jest jedynie na użyteczności4. Widać zatem, że użyteczność i racjonalność są postawami, które nie koniecznie
muszą być maksymalizowane.
Zachowania tego typu są szczególnie widoczne w przypadku popytu na dobra czy
usługi o charakterze ekskluzywnym (co nie jest tożsame z dobrami o charakterze luksusowym), gdzie wartością dodaną jest zespół wartości psychologicznych, które klient, we
własnym rozumieniu otrzymuje, co nie koniecznie musi iść w parze z rzeczywistym
odbiorem danych wartości. Typowym przykładem będzie w tym przypadku moda.
4
90
Paulina Nogal
2. Teoria gier jako narzędzie wspomagające podejmowanie decyzji
Za datę formalnych narodzin teorii gier przyjmuje się powszechnie
1944 r., czyli wydanie monografii Johna Neumanna i Oskara Morgensterna – Theory of Games and Economic Behavior. Podstawą teorii gier jest
opis różnych sytuacji, istotnych o tyle dla podmiotów, które w nich
uczestniczą, że rozstrzygnięcie w ramach podjęcia określonej decyzji
może znacząco zmienić położenie tego podmiotu / podmiotów [Malawski i inni, 1997, s. 12].
Przedsiębiorstwa mogą oddziaływać na siebie na wiele różnych
sposób. Siła tego oddziaływania zależna jest przede wszystkim od wzajemnych stosunków. Może to być przykładowo kooperacja, konkurencja
czy też stosunki o charakterze indyferentnym. Wiele z tych zachowań
można badać przy pomocy teorii gier, gdyż zajmuje się ona właśnie analizą wzajemnych oddziaływań o charakterze strategicznym. Jak pisze
Varian, teoria gier może być użyteczna przy badaniu gier salonowych,
negocjacji politycznych oraz zachowań ekonomicznych [Varian, 2005, s.
512].
Podstawowym założeniem teorii gier jest założenie o racjonalności
wyboru strategii poszczególnych graczy. Z praktycznego punktu widzenia oznacza to, że osoby uczestniczące w grze mają „dowolnie duże
zdolności obliczeniowe i dowolnie doskonałą pamięć” [Malawski i inni,
1997, s. 47]. Doskonała pamięć to nic innego jak wiedza o tym w jaki
sposób zachowywał się dany gracz w przeszłości, również w stosunku
do innego gracza. Wiedza to także świadomość racjonalności innych
graczy. Każdy z graczy zakłada bowiem, że skoro on sam postępuje racjonalnie, to znaczy, że inni także postępują w ten sposób. Mało tego,
inni gracze również wiedzą, że on wie o ich racjonalności. Jakkolwiek
absurdalnie by to nie brzmiało jest to fundamentalne założenie modelu
przedstawionego poniżej.
2.1. Dylemat więźnia, czyli klasyka teorii gier
John Nash5, który prowadził badania nad grami niekooperacyjnymi, w połowie XX wieku wyznaczył punkt równowagi nazwany w późniejszym czasie równowagą Nasha. Punkt ten został zdefiniowany jako
szczególnego rodzaju stan, w którym każdy uczestnik wybiera najlepszą
John Nash (1928 - ) wybitny amerykański matematyk, ekonomista, laureat prestiżowej
nagrody przyznawanej przez Narodowego Banku Szwecji im. Alfreda Nobla w 1994 r.
5
Dylemat więźnia jako przykład wykorzystania teorii gier
91
z możliwych strategię. Przy czym wybrana strategia jest dodatkowo najlepszą odpowiedzią na zachowania wybrane przez pozostałych graczy.
Oznacza to, że żaden z graczy nie ma możliwości poprawienia swojej
sytuacji poprzez wybór innej strategii. Nash badał „gry o dowolnej sumie zerowej i udowodnił, że każda taka gra (ze skończoną ilością strategii każdego gracza) ma równowagę” [Malawski i inni, 1997, s. 30].
Żaden z graczy nie ma pewności, co do ostatecznej decyzji drugiego
gracza. Gracz jest wyposażony jedynie w wiedzę o przesłankach racjonalności, którymi kieruje się on sam i którymi powinien kierować się
drugi z graczy. Wiedza o racjonalności drugiego gracza pozwala pierwszemu oczekiwać, że zachowanie jego konkurenta będzie zmierzało do
maksymalizacji własnego zysku (lub użyteczności). Gracz ma jednak na
uwadze warunki zewnętrzne, czyli to, jaką decyzję podejmie konkurent
i jak wpłynie to na jego własną sytuację. Strategia ta jest warta polecenia
szczególnie wtedy, gdy o drugim graczu wiadomo tylko tyle, że będzie
chciał zminimalizować swoją przegraną [Borucki, 2001, s. 231].
Równowaga Nasha jest nazywana uogólnieniem modelu Cournota.
W modelu tym spotykają się dwaj producenci, a przedmiotem wyboru
jest poziom produkcji każdego z nich. Przy czym każdy przedsiębiorca
definiuje swój poziom produkcji przy założeniu, że jego konkurent
utrzyma dotychczasowy poziom produkcji. „Równowaga Cournota zachodzi wtedy, gdy każda firma maksymalizuje zyski przy danym zachowaniu drugiej firmy” [Varian, 2005, s. 515].
Równowaga Nasha, co do zasady, powinna zachodzić tylko dla
jednego przypadku, jednak istnieją takie gry, w których można wyróżnić więcej niż jeden stan równowagi lub też nie ma żadnego ze stanów
równowagi.
Tradycyjny przykładem pokazującym na czym polega równowaga
Nasha jest dylemat więźnia. Historia przedstawia sytuację dwóch mężczyzn zatrzymanych przez policję, jednak bez wystarczających dowodów na ich winę. Umieszczono ich w osobnych pomieszczeniach oraz
powiedziano, że przyznanie się do winy daje im tylko rok więzienia. W
przypadku, gdy obaj nie przyznają się zostaną wypuszczeni na wolność.
Sytuacja komplikuje się w przypadku, gdy tylko jeden z nich przyzna
się do winy. W ten sposób obciąży drugiego, a sam uzyska korzystny
wyrok. W takim przypadku ten, który przyznał się otrzyma pół roku
więzienia, a drugi aż pięć lat. Macierz wypłat w postaci ilości lat do odsiedzenia w więzieniu przedstawia poniższa tabela.
92
Paulina Nogal
więzień A
Tablica 1. Macierz wypłat dla dylematu więźnia
więzień B
przyznać się
nie przyznać się
przyznać się
-1,-1
-0,5 (A), -5 (B)
nie przyznać się
-5 (A), -0,5 (B)
0, 0
Źródło: Opracowanie własne.
Analizując kolejno sytuacje, które mogą się wydarzyć na skutek
podjęcia konkretnej decyzji przez więźniów, widać, że oboje najlepiej by
zrobili, gdyby zaprzeczyli zarzutom i nie przyznali się do sugerowanego przestępstwa. Jednak żaden z nich nie może mieć pewności, że drugi
również nie przyzna się. W przypadku, gdy jeden z nich przyzna się, a
drugi nie, wówczas ten drugi traci w grze aż pięć lat w stosunku do sytuacji, kiedy obaj się nie przyznają oraz cztery lata w stosunku do sytuacji, kiedy obaj przyznają się [Cooter, Ulen, 2009, s.44]. Zatem najlepszą
decyzją, jaką podejrzani mogą podjąć jest przyznanie się. W tej sytuacji
po prostu tracą najmniej. I jeżeli obaj podejmą racjonalną decyzję, to
wybiorą właśnie tę opcję.
Przedstawiony powyżej dylemat więźnia jest klasyką w teorii gier i w
zasadzie postawą do rozwiązywania bardziej skomplikowanych strategii oraz dylematów. W tym przypadku gracze podjęli decyzję o wyborze
optymalnej strategii i żaden z nich nie ma motywacji do tego, aby ją
zmienić. W przeciwnym razie musiałby porzucić kwestie racjonalności i
zdać się na ryzyko, a tym samym liczyć się z możliwością dotkliwej straty. W opisywanej grze można wyróżnić strategie dominujące dla obu
graczy. Oznacza to, że bez względu na to, jaką decyzję podejmie przeciwnik dla gracza, niech to będzie gracz A, zawsze korzystniejsza będzie
pewna opcja. W tym przypadku będzie to opcja przyznać się. Okazuje
się, że jeśli gracz w jakiejś grze posiada strategię dominującą, wówczas
można przewidywać, że dla rozpatrywanej gry wspomniana strategia
dominująca będzie rozstrzygnięciem gry. „Dzieje się tak dlatego, że strategia dominująca jest strategią najlepszą, niezależnie od tego, co robi
drugi gracz” [Varian, 2005, s. 513].
„Jeśli gra ma się odbyć jedynie raz, to strategia zdrady – w tym
przypadku „przyznania się” – wydaje się rozsądna. Ostatecznie bowiem, niezależnie od wyboru dokonanego przez drugą stronę, jesteśmy
Dylemat więźnia jako przykład wykorzystania teorii gier
93
w lepszej sytuacji, a nie mamy żadnego sposobu, by wpłynąć na zachowanie drugiego gracza” [Varian, 2005, s. 518].
Rozważając dylemat więźnia, równowagą Nasha w tym przypadku
byłoby przyznanie się obu więźniów do winy. Jednak rozpatrując sytuację z punktu widzenia efektywności Pareta – najlepszą sytuacją jest „nie
przyznanie się” obu do winy, dzięki czemu otrzymują najniższy wymiar
kary za popełnione przestępstwo. Ponieważ „nie istnieje inna strategia
wyboru, przy której sytuacja obydwu graczy byłaby lepsza” [Varian,
2005, s. 517]. Problemem w przedstawionym dylemacie jest to, że decyzja, którą podejmują obaj zatrzymani nie jest wyborem strategii optymalnej z punktu widzenia indywidualnego.
Przechodząc na grunt obrotu gospodarczego, podobną sytuację
można przedstawić dla dwóch przedsiębiorstw, które mogą prowadzić
działania marketingowe w celu powiększenia swojego rynku docelowego, a tym samym sprzedaży większej ilości produkowanych dóbr. W
tym przypadku dane są dwie firmy A i B. Każda z nich może prowadzić
działania promocyjne na rzecz zwiększenia przychodów ze sprzedaży.
W przypadku, gdy żadna z nich nie podejmie działań marketingowych,
wówczas żadna z nich nie zarobi więcej, ale i żadna nie straci. W momencie, gdy tylko jedna firma podejmuje decyzję o rozpoczęciu akcji
marketingowej zyskuje ona 300, a ta, która zaniechała działań traci 200,
co obrazuje straty w rynku. W przypadku, gdy obie firmy podejmują
działania promocyjne, obie zyskują po 1006. Wyniki gry firm A i B
przedstawia tabela poniżej.
Tablica 2. Macierz wypłat dla firm A i B
firma A
firma B
reklama
brak reklamy
reklama
100, 100
300 (A), -200 (B)
brak reklamy
-200 (A), 300 (B)
0, 0
Źródło: Opracowanie własne.
Zakładając, że firmy działają na rynku, na którym panuje duopol, można przyjąć
uproszczenie, że zysk, który osiągają wynika ze zwiększonej sprzedaży części dotychczasowych klientów, jak również mogła wystąpić sytuacja, która spowodowała, firmy
„wymieniły” się częścią klientów.
6
94
Paulina Nogal
Analizując przedstawiony przypadek dla firmy A, w przypadku,
gdy firma powstrzymuje się od działań promocyjnych, może stracić 200
lub w najlepszym wypadku nic. Natomiast podejmując działania promocyjne może zyskać 100 lub 300. Oczywistym wydaje się zatem, że
lepiej jest podjąć działania promocyjne i dostać cokolwiek niż liczyć na
szczęśliwy traf zachowania status quo.
Zakończenie
Strategia typu dylemat więźnia jest przykładem strategii, gdzie
każdy z graczy musiał dokonać wyboru nie wiedząc do końca, jakiego
wyboru dokona drugi z graczy. Tak więc, każdy musiał podjąć decyzję o
swoim położeniu jedynie na postawie wydedukowanej motywacji drugiego gracza.
Istnieje szereg bardziej skomplikowanych strategii dostosowanych
do skomplikowanych sytuacji życia codziennego, które wręcz wymuszają posiłkowanie się znacznie bardziej zaawansowanymi modelami.
Nie wyklucza to jednak przyswojenia informacji o elementarnych założeniach racjonalności w odniesieniu do takiej sytuacją, jaką jest dylemat
więźnia. Dylemat ten, choć wydaje się banalny, wcale nie musi taki być w
rzeczywistości, bez względu na to, czy strony współpracują ze sobą raz
czy nieskończoną ilość razy. Oczywiście sytuacja komplikuje się, gdy
strony z góry wiedzą, że ich współpraca odbędzie się skończoną ilość
razy, lub, co nawet gorsze, gdy tylko jedna strona o tym wie. Odwołując
się jednak do treści rozwiniętych w artykule można wnioskować, że
strony będą starały się unikać wzajemnego „zdradzania”, ponieważ będą zabiegać o wzajemne zaufanie oraz wypracowanie dobrej reputacji.
Należy się spodziewać, że bodźce do współpracy będą raczej wzmacniane, a „zdradzający” zostaną wyeliminowani z rynku na zasadzie nieefektywności rynku.
Literatura
1. Assignments and Activities of Topical Editors – Traditional Journals, Copernicus Publications, http://publications.copernicus.org/assign
ments_and_activies_of_topical_editors_traditional_journals.pdf,
dostęp dnia 23.04.2012.
2. Bartkowiak R. (2008), Historia myśli ekonomicznej, Polskie Wydawnictwo Ekonomiczne, Warszawa.
3. Borucki W. (2001) Gry i strategie, w: Ignasiak E. (red.), Badania operacyjne, Polskie Wydawnictwo Ekonomiczne, Warszawa.
Dylemat więźnia jako przykład wykorzystania teorii gier
95
4. Cooter R., Ulen T. 2009, Ekonomiczna analiza prawa, Wydawnictwo
C.H. Beck, Warszawa.
5. Frank R.H. (2007), Mikroekonomia jakiej jeszcze nie było, Gdańskie Wydawnictwo Psychologiczne, Gdańsk.
6. Landreth H., Conalder D.C. (2005), Historia myśli ekonomicznej, Wydawnictwo Naukowe PWN, Warszawa.
7. Malawski M., Wieczorek A., Sosnowska H. (1997) Konkurencja i kooperacja. Teoria gier w ekonomii i naukach społecznych, Wydawnictwo
Naukowe PWN, Warszawa.
8. Matematyka stosowana, Optymalizacja II, http://mst.mimuw.edu.
pl/lecture.php?lecture=op2&part=Ch10, dostęp z dnia 17.07.2012
9. Varian H.R. (2005), Mikroekonomia. Kurs średni – ujęcie nowoczesne,
Wydawnictwo Naukowe PWN, Warszawa.
Streszczenie
Artykuł przedstawia słynny problem z zakresu teorii gier, jakim jest dylemat więźnia. Tym samym została zamieszczona macierz wypłat każdego z graczy. Kluczowym zagadnieniem, które zostało poruszone, jest równowaga
Nasha. Problem został omówiony również na przykładzie zaczerpniętym z
życia gospodarczego. Dodatkowo zostały omówione kryteria zastosowania
modelu, którymi posługują się gracze wybierając swoją strategię dominującą, a
mianowicie – racjonalność oraz użyteczność.
Słowa kluczowe
teoria gier, równowaga Nasha
The Prisoner's Dilemma as a starting point of advanced game theory
considerations (Summary)
The article presents the famous problem of game theory, which is the prisoner's dilemma. Therefore, the payoff matrix has been placed for each player. A
key issue that was mentioned is Nash equilibrium. The issue was also discussed
as an example drawn from the economic life. In addition, the application criteria using by players in the model was described. Mentioned criteria used by
players in choosing their dominant strategy are rationality and utility.
Keywords
game theory, Nash equilibrium
Download