Paulina Nogal* Dylemat więźnia jako przykład wykorzystania teorii gier Wstęp Na skutek postępu technologicznego, rozwoju nowych możliwości komunikowania się, przesyłania informacji na odległość, przewidywanie przyszłości zaczyna przypominać wróżenie z fusów. Prędkość obiegu informacji staje się tak duża, że opracowanie długofalowej, wiarygodnej strategii dla firmy staje się coraz trudniejszym wyzwaniem. Przedsiębiorcy z długoletnim stażem na rynku nabierają doświadczenia w tej ekstremalnej sztuce1, początkujący natomiast zdają się na łut szczęścia, który w grach hazardowych określany jest jako beginners luck. Na czym więc oprzeć wnioskowanie i co brać po uwagę, a także jak oceniać swoich przeciwników, skoro niczego już nie można być pewnym? W tej sytuacji pomocne może okazać się wykorzystanie matematycznych narzędzi oraz mikroekonomicznych założeń, a dokładniej – skorzystanie z aparatu „obliczeniowego” jaki daje teoria gier. Podstawowe modele zakładają, że osoby, które znalazły się w konfliktowej sytuacji, rozwiążą ją za pomocą logicznego myślenia, a w szczególności za pomocą racjonalności i użyteczności. Problem polega w tym, że nie dla każdego racjonalność oznacza to samo, a tym bardziej każdy człowiek może maksymalizować użyteczność przy osiąganiu innych wartości. Prekursorzy mikroekonomii zdawali się jednak nie przejmować tymi ograniczeniami, gdyż „siła modelu wynika właśnie z wyeliminowania informacji mających niewielkie znaczenie, co pozwala ekonomiście skupić się na zasadniczych, istotnych cechach rzeczywistości ekonomicznej, którą usiłuje zrozumieć” [Varian, 2005, s. 31]. Celem artykułu jest przedstawienie modelu równowagi Nasha na przykładzie gier niekooperatywnych o charakterze niepowtarzalnym oraz możliwości ich zastosowania w życiu gospodarczym. Głównym założeniem w tym przypadku jest racjonalne postępowanie jednostek, Mgr, Katedra Ekonomiki Przedsiębiorstw, Wydział Zarządzania, Uniwersytet Gdański, [email protected], ul. Armii Krajowej 101, 81-824 Sopot 1 Nie jest to oczywiście reguła, a jedynie uogólnienie. Vide Nokia. * 88 Paulina Nogal dzięki któremu optymalizują one swoje położenie pod względem ekonomicznym. W artykule została zastosowana metoda dedukcji wspomagana metodą deskryptywną. 1. O racjonalności i maksymalizowaniu użyteczności Teoria gier, mimo, iż jej właściwym miejscem jest matematyka, to jest głęboko zakorzeniona w mikroekonomicznych aspektach rzeczywistości gospodarczej. Ekonomiści są raczej zgodni co do faktu, że za pierwszy model tego rodzaju można przyjąć model równowagi Cournota (opublikowany w 1838 r.). Nie brakuje jednak opinii, że elementy teorii gier można znaleźć już u Arystotelesa – w szczególności w konfliktach politycznych. W związku z tym, że strategie rozpatrywane w grach są niczym innym jak tylko przedstawieniem sytuacji konfliktowych2 jakie zdarzają się jednostkom nie dziwi zatem fakt, że towarzyszyły człowiekowi w zasadzie od zawsze. Kwestią tylko było metodologiczne wyprowadzenie tych teorii w matematyce tak, aby uzyskać możliwość ich stosowania w ekonomii, psychologii czy nawet biologii3. Pierwszym, fundamentalnym założeniem, jeśli chodzi o analizę zachowań mikroekonomicznych, jest przyjęcie, że człowiek zachowuje się w sposób racjonalny. Przyjmuje się wobec tego, że człowiek zastanawia się nad swoim zachowaniem, kalkulując przy tym, co mu się bardziej opłaca nie tylko w sensie ekonomicznym, ale również w ramach szeroko pojętej użyteczności. Co więcej, człowiek dokonuje wyborów swoich decyzji na podstawie zachowań innych ludzi, czyli analizuje wzajemną i końcową wartość ekonomiczną w wyniku danej interakcji. Racjonalność rozpatrywana w kwestiach etymologicznych opiera się na założeniu, że człowiek aktywnie wykorzystuje rozum w sensie obliczeniowo-kalkulacyjnym. W ramach analizy mikroekonomicznej mamy do czynienia z dokładnie takim samym zachowaniem. Jest ono jedynie doprecyzowane w ten sposób, że jednostki (podmioty) działające na rynku w pierwszej kolejności muszą określić cel prowadzenia działalności, a następnie, rozważając ograniczone zasoby, minimalizować koszty (produkcja = constans) lub maksymalizować produkcję (koszty = constans). Bardziej precyzyjnym określeniem byłoby opisanie teorii gier jako szukanie optymalnego zachowania się jednostek w przypadku konfliktu interesów. 3 [Malawski, 1997] 2 Dylemat więźnia jako przykład wykorzystania teorii gier 89 Szeroko pojęta racjonalność została podzielona w mikroekonomii na dwa standardy. Pierwszy z nich opiera się na zasadach celu, drugi – na korzyści własnej [Frank, 2007, s. 261]. Przy czym ani o jednym ani o drugim nie można powiedzieć, że jest w pełni wiarygodny. Racjonalność oparta na celu pomija bowiem analizę celu pod względem jego celowości. Jakkolwiek dziwnie to brzmi nie jest jednak pozbawione sensu. Cel celu człowieka nie ma w tym wypadku żadnego znaczenia. Oznacza to, że osoba posiadająca preferencje autodestrukcyjne będzie analizowana z punktu widzenia skuteczności realizowania swoich autodestrukcyjnych zachowań. Powinna zatem zachowywać się w sposób autodestrukcyjny możliwie jak najbardziej skutecznie. Z kolei rozpatrując racjonalność z punktu widzenia tylko i wyłącznie własnej korzyści należałoby dojść do wniosku, że homo oeconomicus, to nic innego jak przypadek człowieka bezwzględnie egoistycznego, który całą swoją uwagę skupia na maksymalizowaniu efektywności ekonomicznej własnej egzystencji. Tym samym postawa altruistyczna, trzymanie się zasad czy pragnienie sprawiedliwości są mu zupełnie obce. W zakresie użyteczności, ciekawe stwierdzenie sformułowali Jevons, Menger i Walras. Twierdzili oni bowiem, że wysokie koszty, które zostały poniesione dla wytworzenia danego dobra czy usługi nie koniecznie muszą prowadzić do wysokiej ceny. Teoria użyteczności krańcowej wskazuje, że dla konsumenta czy też innego podmiotu działającego z danym przedsiębiorstwem, cena danego dobra czy też usługi zależy od tego jaki poziom użyteczności przedstawia dana rzecz dla danej osoby. Oznacza to, że użyteczność „bierze swój początek nie z przeszłości, lecz z przyszłości” [Landreth, Colander, 2005, s. 240]. Takie podejście pokazuje, jak dalece określone zachowanie może być pozbawione racjonalności, kiedy oparte jest jedynie na użyteczności4. Widać zatem, że użyteczność i racjonalność są postawami, które nie koniecznie muszą być maksymalizowane. Zachowania tego typu są szczególnie widoczne w przypadku popytu na dobra czy usługi o charakterze ekskluzywnym (co nie jest tożsame z dobrami o charakterze luksusowym), gdzie wartością dodaną jest zespół wartości psychologicznych, które klient, we własnym rozumieniu otrzymuje, co nie koniecznie musi iść w parze z rzeczywistym odbiorem danych wartości. Typowym przykładem będzie w tym przypadku moda. 4 90 Paulina Nogal 2. Teoria gier jako narzędzie wspomagające podejmowanie decyzji Za datę formalnych narodzin teorii gier przyjmuje się powszechnie 1944 r., czyli wydanie monografii Johna Neumanna i Oskara Morgensterna – Theory of Games and Economic Behavior. Podstawą teorii gier jest opis różnych sytuacji, istotnych o tyle dla podmiotów, które w nich uczestniczą, że rozstrzygnięcie w ramach podjęcia określonej decyzji może znacząco zmienić położenie tego podmiotu / podmiotów [Malawski i inni, 1997, s. 12]. Przedsiębiorstwa mogą oddziaływać na siebie na wiele różnych sposób. Siła tego oddziaływania zależna jest przede wszystkim od wzajemnych stosunków. Może to być przykładowo kooperacja, konkurencja czy też stosunki o charakterze indyferentnym. Wiele z tych zachowań można badać przy pomocy teorii gier, gdyż zajmuje się ona właśnie analizą wzajemnych oddziaływań o charakterze strategicznym. Jak pisze Varian, teoria gier może być użyteczna przy badaniu gier salonowych, negocjacji politycznych oraz zachowań ekonomicznych [Varian, 2005, s. 512]. Podstawowym założeniem teorii gier jest założenie o racjonalności wyboru strategii poszczególnych graczy. Z praktycznego punktu widzenia oznacza to, że osoby uczestniczące w grze mają „dowolnie duże zdolności obliczeniowe i dowolnie doskonałą pamięć” [Malawski i inni, 1997, s. 47]. Doskonała pamięć to nic innego jak wiedza o tym w jaki sposób zachowywał się dany gracz w przeszłości, również w stosunku do innego gracza. Wiedza to także świadomość racjonalności innych graczy. Każdy z graczy zakłada bowiem, że skoro on sam postępuje racjonalnie, to znaczy, że inni także postępują w ten sposób. Mało tego, inni gracze również wiedzą, że on wie o ich racjonalności. Jakkolwiek absurdalnie by to nie brzmiało jest to fundamentalne założenie modelu przedstawionego poniżej. 2.1. Dylemat więźnia, czyli klasyka teorii gier John Nash5, który prowadził badania nad grami niekooperacyjnymi, w połowie XX wieku wyznaczył punkt równowagi nazwany w późniejszym czasie równowagą Nasha. Punkt ten został zdefiniowany jako szczególnego rodzaju stan, w którym każdy uczestnik wybiera najlepszą John Nash (1928 - ) wybitny amerykański matematyk, ekonomista, laureat prestiżowej nagrody przyznawanej przez Narodowego Banku Szwecji im. Alfreda Nobla w 1994 r. 5 Dylemat więźnia jako przykład wykorzystania teorii gier 91 z możliwych strategię. Przy czym wybrana strategia jest dodatkowo najlepszą odpowiedzią na zachowania wybrane przez pozostałych graczy. Oznacza to, że żaden z graczy nie ma możliwości poprawienia swojej sytuacji poprzez wybór innej strategii. Nash badał „gry o dowolnej sumie zerowej i udowodnił, że każda taka gra (ze skończoną ilością strategii każdego gracza) ma równowagę” [Malawski i inni, 1997, s. 30]. Żaden z graczy nie ma pewności, co do ostatecznej decyzji drugiego gracza. Gracz jest wyposażony jedynie w wiedzę o przesłankach racjonalności, którymi kieruje się on sam i którymi powinien kierować się drugi z graczy. Wiedza o racjonalności drugiego gracza pozwala pierwszemu oczekiwać, że zachowanie jego konkurenta będzie zmierzało do maksymalizacji własnego zysku (lub użyteczności). Gracz ma jednak na uwadze warunki zewnętrzne, czyli to, jaką decyzję podejmie konkurent i jak wpłynie to na jego własną sytuację. Strategia ta jest warta polecenia szczególnie wtedy, gdy o drugim graczu wiadomo tylko tyle, że będzie chciał zminimalizować swoją przegraną [Borucki, 2001, s. 231]. Równowaga Nasha jest nazywana uogólnieniem modelu Cournota. W modelu tym spotykają się dwaj producenci, a przedmiotem wyboru jest poziom produkcji każdego z nich. Przy czym każdy przedsiębiorca definiuje swój poziom produkcji przy założeniu, że jego konkurent utrzyma dotychczasowy poziom produkcji. „Równowaga Cournota zachodzi wtedy, gdy każda firma maksymalizuje zyski przy danym zachowaniu drugiej firmy” [Varian, 2005, s. 515]. Równowaga Nasha, co do zasady, powinna zachodzić tylko dla jednego przypadku, jednak istnieją takie gry, w których można wyróżnić więcej niż jeden stan równowagi lub też nie ma żadnego ze stanów równowagi. Tradycyjny przykładem pokazującym na czym polega równowaga Nasha jest dylemat więźnia. Historia przedstawia sytuację dwóch mężczyzn zatrzymanych przez policję, jednak bez wystarczających dowodów na ich winę. Umieszczono ich w osobnych pomieszczeniach oraz powiedziano, że przyznanie się do winy daje im tylko rok więzienia. W przypadku, gdy obaj nie przyznają się zostaną wypuszczeni na wolność. Sytuacja komplikuje się w przypadku, gdy tylko jeden z nich przyzna się do winy. W ten sposób obciąży drugiego, a sam uzyska korzystny wyrok. W takim przypadku ten, który przyznał się otrzyma pół roku więzienia, a drugi aż pięć lat. Macierz wypłat w postaci ilości lat do odsiedzenia w więzieniu przedstawia poniższa tabela. 92 Paulina Nogal więzień A Tablica 1. Macierz wypłat dla dylematu więźnia więzień B przyznać się nie przyznać się przyznać się -1,-1 -0,5 (A), -5 (B) nie przyznać się -5 (A), -0,5 (B) 0, 0 Źródło: Opracowanie własne. Analizując kolejno sytuacje, które mogą się wydarzyć na skutek podjęcia konkretnej decyzji przez więźniów, widać, że oboje najlepiej by zrobili, gdyby zaprzeczyli zarzutom i nie przyznali się do sugerowanego przestępstwa. Jednak żaden z nich nie może mieć pewności, że drugi również nie przyzna się. W przypadku, gdy jeden z nich przyzna się, a drugi nie, wówczas ten drugi traci w grze aż pięć lat w stosunku do sytuacji, kiedy obaj się nie przyznają oraz cztery lata w stosunku do sytuacji, kiedy obaj przyznają się [Cooter, Ulen, 2009, s.44]. Zatem najlepszą decyzją, jaką podejrzani mogą podjąć jest przyznanie się. W tej sytuacji po prostu tracą najmniej. I jeżeli obaj podejmą racjonalną decyzję, to wybiorą właśnie tę opcję. Przedstawiony powyżej dylemat więźnia jest klasyką w teorii gier i w zasadzie postawą do rozwiązywania bardziej skomplikowanych strategii oraz dylematów. W tym przypadku gracze podjęli decyzję o wyborze optymalnej strategii i żaden z nich nie ma motywacji do tego, aby ją zmienić. W przeciwnym razie musiałby porzucić kwestie racjonalności i zdać się na ryzyko, a tym samym liczyć się z możliwością dotkliwej straty. W opisywanej grze można wyróżnić strategie dominujące dla obu graczy. Oznacza to, że bez względu na to, jaką decyzję podejmie przeciwnik dla gracza, niech to będzie gracz A, zawsze korzystniejsza będzie pewna opcja. W tym przypadku będzie to opcja przyznać się. Okazuje się, że jeśli gracz w jakiejś grze posiada strategię dominującą, wówczas można przewidywać, że dla rozpatrywanej gry wspomniana strategia dominująca będzie rozstrzygnięciem gry. „Dzieje się tak dlatego, że strategia dominująca jest strategią najlepszą, niezależnie od tego, co robi drugi gracz” [Varian, 2005, s. 513]. „Jeśli gra ma się odbyć jedynie raz, to strategia zdrady – w tym przypadku „przyznania się” – wydaje się rozsądna. Ostatecznie bowiem, niezależnie od wyboru dokonanego przez drugą stronę, jesteśmy Dylemat więźnia jako przykład wykorzystania teorii gier 93 w lepszej sytuacji, a nie mamy żadnego sposobu, by wpłynąć na zachowanie drugiego gracza” [Varian, 2005, s. 518]. Rozważając dylemat więźnia, równowagą Nasha w tym przypadku byłoby przyznanie się obu więźniów do winy. Jednak rozpatrując sytuację z punktu widzenia efektywności Pareta – najlepszą sytuacją jest „nie przyznanie się” obu do winy, dzięki czemu otrzymują najniższy wymiar kary za popełnione przestępstwo. Ponieważ „nie istnieje inna strategia wyboru, przy której sytuacja obydwu graczy byłaby lepsza” [Varian, 2005, s. 517]. Problemem w przedstawionym dylemacie jest to, że decyzja, którą podejmują obaj zatrzymani nie jest wyborem strategii optymalnej z punktu widzenia indywidualnego. Przechodząc na grunt obrotu gospodarczego, podobną sytuację można przedstawić dla dwóch przedsiębiorstw, które mogą prowadzić działania marketingowe w celu powiększenia swojego rynku docelowego, a tym samym sprzedaży większej ilości produkowanych dóbr. W tym przypadku dane są dwie firmy A i B. Każda z nich może prowadzić działania promocyjne na rzecz zwiększenia przychodów ze sprzedaży. W przypadku, gdy żadna z nich nie podejmie działań marketingowych, wówczas żadna z nich nie zarobi więcej, ale i żadna nie straci. W momencie, gdy tylko jedna firma podejmuje decyzję o rozpoczęciu akcji marketingowej zyskuje ona 300, a ta, która zaniechała działań traci 200, co obrazuje straty w rynku. W przypadku, gdy obie firmy podejmują działania promocyjne, obie zyskują po 1006. Wyniki gry firm A i B przedstawia tabela poniżej. Tablica 2. Macierz wypłat dla firm A i B firma A firma B reklama brak reklamy reklama 100, 100 300 (A), -200 (B) brak reklamy -200 (A), 300 (B) 0, 0 Źródło: Opracowanie własne. Zakładając, że firmy działają na rynku, na którym panuje duopol, można przyjąć uproszczenie, że zysk, który osiągają wynika ze zwiększonej sprzedaży części dotychczasowych klientów, jak również mogła wystąpić sytuacja, która spowodowała, firmy „wymieniły” się częścią klientów. 6 94 Paulina Nogal Analizując przedstawiony przypadek dla firmy A, w przypadku, gdy firma powstrzymuje się od działań promocyjnych, może stracić 200 lub w najlepszym wypadku nic. Natomiast podejmując działania promocyjne może zyskać 100 lub 300. Oczywistym wydaje się zatem, że lepiej jest podjąć działania promocyjne i dostać cokolwiek niż liczyć na szczęśliwy traf zachowania status quo. Zakończenie Strategia typu dylemat więźnia jest przykładem strategii, gdzie każdy z graczy musiał dokonać wyboru nie wiedząc do końca, jakiego wyboru dokona drugi z graczy. Tak więc, każdy musiał podjąć decyzję o swoim położeniu jedynie na postawie wydedukowanej motywacji drugiego gracza. Istnieje szereg bardziej skomplikowanych strategii dostosowanych do skomplikowanych sytuacji życia codziennego, które wręcz wymuszają posiłkowanie się znacznie bardziej zaawansowanymi modelami. Nie wyklucza to jednak przyswojenia informacji o elementarnych założeniach racjonalności w odniesieniu do takiej sytuacją, jaką jest dylemat więźnia. Dylemat ten, choć wydaje się banalny, wcale nie musi taki być w rzeczywistości, bez względu na to, czy strony współpracują ze sobą raz czy nieskończoną ilość razy. Oczywiście sytuacja komplikuje się, gdy strony z góry wiedzą, że ich współpraca odbędzie się skończoną ilość razy, lub, co nawet gorsze, gdy tylko jedna strona o tym wie. Odwołując się jednak do treści rozwiniętych w artykule można wnioskować, że strony będą starały się unikać wzajemnego „zdradzania”, ponieważ będą zabiegać o wzajemne zaufanie oraz wypracowanie dobrej reputacji. Należy się spodziewać, że bodźce do współpracy będą raczej wzmacniane, a „zdradzający” zostaną wyeliminowani z rynku na zasadzie nieefektywności rynku. Literatura 1. Assignments and Activities of Topical Editors – Traditional Journals, Copernicus Publications, http://publications.copernicus.org/assign ments_and_activies_of_topical_editors_traditional_journals.pdf, dostęp dnia 23.04.2012. 2. Bartkowiak R. (2008), Historia myśli ekonomicznej, Polskie Wydawnictwo Ekonomiczne, Warszawa. 3. Borucki W. (2001) Gry i strategie, w: Ignasiak E. (red.), Badania operacyjne, Polskie Wydawnictwo Ekonomiczne, Warszawa. Dylemat więźnia jako przykład wykorzystania teorii gier 95 4. Cooter R., Ulen T. 2009, Ekonomiczna analiza prawa, Wydawnictwo C.H. Beck, Warszawa. 5. Frank R.H. (2007), Mikroekonomia jakiej jeszcze nie było, Gdańskie Wydawnictwo Psychologiczne, Gdańsk. 6. Landreth H., Conalder D.C. (2005), Historia myśli ekonomicznej, Wydawnictwo Naukowe PWN, Warszawa. 7. Malawski M., Wieczorek A., Sosnowska H. (1997) Konkurencja i kooperacja. Teoria gier w ekonomii i naukach społecznych, Wydawnictwo Naukowe PWN, Warszawa. 8. Matematyka stosowana, Optymalizacja II, http://mst.mimuw.edu. pl/lecture.php?lecture=op2&part=Ch10, dostęp z dnia 17.07.2012 9. Varian H.R. (2005), Mikroekonomia. Kurs średni – ujęcie nowoczesne, Wydawnictwo Naukowe PWN, Warszawa. Streszczenie Artykuł przedstawia słynny problem z zakresu teorii gier, jakim jest dylemat więźnia. Tym samym została zamieszczona macierz wypłat każdego z graczy. Kluczowym zagadnieniem, które zostało poruszone, jest równowaga Nasha. Problem został omówiony również na przykładzie zaczerpniętym z życia gospodarczego. Dodatkowo zostały omówione kryteria zastosowania modelu, którymi posługują się gracze wybierając swoją strategię dominującą, a mianowicie – racjonalność oraz użyteczność. Słowa kluczowe teoria gier, równowaga Nasha The Prisoner's Dilemma as a starting point of advanced game theory considerations (Summary) The article presents the famous problem of game theory, which is the prisoner's dilemma. Therefore, the payoff matrix has been placed for each player. A key issue that was mentioned is Nash equilibrium. The issue was also discussed as an example drawn from the economic life. In addition, the application criteria using by players in the model was described. Mentioned criteria used by players in choosing their dominant strategy are rationality and utility. Keywords game theory, Nash equilibrium