TEORIA GIER 1. Wstęp Teoria gier jest dziedziną zajmującą się opisem sytuacji, w których podmioty (gracze) podejmujący świadome decyzje (nazywane strategie), w wyniku których zapadają rozstrzygnięcia mogące zmienić ich położenie. Teoria gier zajmuje się głównie sytuacjami konfliktowymi, ale także sytuacjami w których interesy graczy są zgodne, ale z uwagi na problemy w porozumiewaniu się, trudno im ustalić właściwy sposób postępowania. W opisie każdej gry powinny wystąpić następujące elementy : - wyszczególnienie uczestników gry, - określenie możliwości postępowania każdego gracza, - opis dostępnej graczom informacji, - możliwe precyzyjne określenie celów do których dążą gracze. Teoria gier prezentuje normatywne podejście do podejmowania decyzji, starając się wskazać "racjonalne" sposoby postępowania, głównie w sytuacjach konfliktowych. Świadomie zakłada, że uczestnicy gry są "racjonalni". To mocne założenie oznacza w szczególności, że każdy z graczy posiada - dowolnie duże możliwości obliczeniowe, - doskonałą pamięć, - umiejętność wskazania, który z wyników gry jest "lepszy". Standardowo przyjmuje się założenie o wspólnej wiedzy graczy o ich racjonalności : oznacza to nie tylko to, że każdy gracz wie, iż inni są racjonalni : musi on także wiedzieć, że każdy z graczy zdaje sobie sprawę z racjonalności pozostałych graczy. Oznacza to, że każdy z graczy jest w stanie określić strategie, które mogą wybrać inni gracze i dostosować do tego swoje postępowanie, mając świadomość, że inni gracze postępują identycznie. Wspólna wiedza dotyczy nie tylko zachowań (reguł postępowania), ale i samej gry : każdy zna jej reguły i wypłaty (swoje i uczestników). Wspólna wiedza o racjonalności nie musi prowadzić do zachowań, które postronny obserwator uznał by za racjonalne. Może to wynikać z reguł gry, a nie "nieracjonalnych" zachowań graczy. Nasze zainteresowania skupimy na sformalizowanym opisie sytuacji decyzyjnej w której gracze (jednostki, przedsiębiorstwa, państwa) konkurują ze sobą dążąc do maksymalizacji swoich korzyści (zysku, udziału w rynku itp.). Korzyści graczy określa macierz wypłat postaci [aij , bij ] , gdzie a ij i bij są wypłatami (korzyściami) gracza I i II w przypadku, gdy gracz I podjął decyzję i a gracz II decyzję j. Wygrana jednego z graczy nie jest przegraną drugiego gracza (taka gra jest grą o sumie niezerowej). Jeżeli przegrana jednego gracza jest wygraną drugiego, wówczas wypłatę określa macierz [aij ] (gra o sumie zerowej ; bij = −aij ). Wypłata gracza I zależy od jego decyzji (strategii) i oraz decyzji j podjętej przez gracza II (konkurenta) i vice versa. Wiersze macierzy wypłat odpowiadają strategii gracza I, a kolumny strategii gracza II. 1 J. Marcinkowski Badania operacyjne Znajomość macierzy wypłat zakłada możliwość określenia przez obie strony wypłat każdego z graczy dla każdej kombinacji strategii. Szukając rozwiązania gry, tj. kombinacji decyzji najkorzystniejszych dla obu graczy, zakłada się, że każdy z nich dąży, zachowując się racjonalnie, do maksymalizacji własnych korzyści (a nie np. strat przeciwnika). 2. Klasyfikacja gier Klasyfikacji gier możemy dokonać ze względu na : - liczbę uczestników gry, wyróżniając : - gry dwuosobowe, - gry n-osobowe, - możliwości komunikowania się graczy, wyróżniając: - gry kooperacyjne, - gry niekooperacyjne, - charakter gry, wyróżniając: - gry rozgrywane jednokrotnie, - gry rozgrywane wielokrotnie (gry sekwencyjne). - rodzaj wypłat, wyróżniając: - gry o sumie zerowej, - gry sumie niezerowej, - dostępną informację, wyróżniając: - gry z pełną informacją, - gry z niepełną informacją, - liczbę strategii, wyróżniając: - gry ze skończoną liczbą strategii, - gry z nieskończoną liczbą strategii. Przedmiotem naszego zainteresowania będą gry dwuosobowe o sumie niezerowej, rozgrywane jednokrotnie, z pełną informacją i skończoną liczbą strategii. 3. Gry dwuosobowe o sumie niezerowej Rozważmy dwuosobową, niekooperacyjną grę o następującej macierzy wypłat : Firma II A Firma I Wypłaty interpretujemy jako zyski z działalności produkcyjnej. Strategia A - duża skala produkcji, strategia B - mała skala produkcji. Zakładamy, że dobra wytwarzane przez obie firmy są komplementarne. Oznacza to, że zwiększenie zbytu jednego dobra sprzyja zwiększeniu zbytu B A ⎡(500, 500) (300, 300) ⎤ ⎢ ⎥ B ⎣(250, 250) (125, 125)⎦ drugiego dobra Strategią dominującą nazywamy strategię przynoszącą graczowi najwyższą wypłatę niezależnie od strategii obranej przez konkurenta. W naszym przypadku strategiami dominującymi jest para strategii (A,A). Kooperacja jest zbędna : nie istnieje para strategii osiągalnych dzięki kooperacji, która dała by wyższą wypłatę niż para strategii dominujących. Strategie i* oraz j* nazywamy strategiami dominującymi, jeżeli spełnione są warunki : ∨ ∧ aij* ≥ aij j * i ≠ i* ∨∧ i* j ≠ j * i co najmniej dla jednego i aij* ≥ aij , bi* j ≥ bij i co najmniej dla jednego j bi* j > bij . 2 J. Marcinkowski Badania operacyjne Jeżeli obaj gracze posiadają strategie dominujące, to zazwyczaj je wybierają. Gra posiada stan równowagi określony przez parę tych strategii. Jest on stabilny, gdyż żadnemu z graczy nie opłaca się odstąpić od strategii dominującej, niezależnie od tego co zrobi konkurent. Strategię dominującą może posiadać tylko jeden gracz, gra może nie mieć strategii dominujących. II A II B A A ⎡(500, 500) (300, 300) ⎤ ⎢ ⎥ B ⎣(600, 250) (125, 125)⎦ I I Gracz I nie ma strategii dominującej, dla gracza II jest nią strategia A B A ⎡(500, 500) (300, 600) ⎤ ⎢ ⎥ B ⎣(600, 250) (125, 125)⎦ Żaden z graczy nie ma strategii dominującej Jeżeli gra nie ma strategii dominujących, powstaje następujący problem : czy jest możliwe zdefiniowanie pojęcia równowagi? Nash zaproponował słabszą koncepcję równowagi, nie opartej na układzie strategii dominujących.1 II C I D C ⎡(350, 350) ⎢ D ⎣(300, 450) (350, 300) ⎤ (400, 400)⎥⎦ Powiemy, że strategie graczy tworzą równowagę Nasha, jeżeli maksymalizują wypłatę gracza przy danym wyborze drugiego gracza. Oznacza to, że jeżeli każdy z graczy dokonał wyboru, to żadnemu z nich nie opłaca się odstąpić od wybranej strategii. W naszym przypadku strategiami tymi są strategie (C, C). Jeżeli gracz I wybierze strategię C, to graczowi drugiemu nie opłaca się odstępstwo (bo 300 < 350). Jeżeli gracz II wybierze C, to graczowi I także nie opłaca się dokonanie odstępstwa. Powiemy, że strategie i* oraz j* pozostają w równowadze Nasha, jeżeli spełnione są warunki : ∧ ai* j* ≥ aij* i dla co najmniej jednego i ai* j* > aij* , i ≠ i* ∧ j ≠ j* bi* j* ≥ bi* j i dla co najmniej jednego j bi* j* > bi* j . W zależności od struktury macierzy wypłat może istnieć jedna równowaga Nasha, wiele równowag Nasha, bądź też może nie być takiej równowagi. II C I C ⎡(350, 350) ⎢ D ⎣(400, 450) II D C (350, 400) ⎤ (300, 400)⎥⎦ I Dwie równowagi Nasha : (C,D) i (D,C). Równowaga (D,C) jest bardziej korzystna dla każdego z graczy (400 > 350, 450 > 400) D C ⎡(700, 500) (300, 600) ⎤ ⎢ ⎥ D ⎣(600, 250) (400, 125)⎦ Brak równowagi Nasha W przypadku istnienia więcej niż jednej równowagi Nasha, brak jest jednoznacznego rozwiązania gry. 1 Istnieje wiele innych koncepcji równowagi, które nie będą przedmiotem naszego zainteresowania 3 J. Marcinkowski Badania operacyjne Jeżeli jedna z równowag Nasha jest korzystniejsza dla każdego gracza, obaj gracze wybiorą ją, nie mając nawet możliwości porozumienia się. Może się zdarzyć, że jedna z równowag jest korzystniejsza dla jednego z graczy, druga dla drugiego. Trudno wtedy o sensowny wybór. Równowaga określona przez strategie dominujące nazywana jest równowagą globalną, równowaga w sensie Nasha - lokalną (warunkową). Jeżeli gra posiada równowagę w sensie Nasha i jeden z graczy od niej odstąpi (np. w wyniku błędu), drugiemu także może opłacać się odstępstwo. Jeżeli gra posiada rozwiązanie w sensie strategii dominujących, to maksymalizacja korzyści indywidualnych przy odpowiedniej strukturze macierzy wypłat prowadzi do maksymalizacji korzyści zbiorowej (łącznej korzyści obu graczy będącej sumą wypłat każdego nich). W pozostałych przypadkach maksymalizacja korzyści indywidualnych nie prowadzi do maksymalizacji łącznej korzyści obu graczy. Dążenie do maksymalizacji korzyści indywidualnych może prowadzić do podejmowania decyzji nie tylko nie maksymalizujących łącznej wypłaty graczy, ale także wypłat każdego nich (np. dylemat więźnia). Stanowi to argument przemawiający na rzecz interwencjonizmu, gdyż nie w każdych warunkach swobodna gra rynkowa musi prowadzić do maksymalizacji korzyści jej uczestników. 4. Dylemat więźnia Opisuje sytuacje, kiedy dążenie do maksymalizacji korzyści indywidualnych prowadzi do niekorzystnych rozwiązań dla każdego z graczy. II W Z W ⎡( N , N ) ( F , P ) ⎤ I ⎢ ⎥ Z ⎣( P, F ) ( K , K ) ⎦ Wypłaty : P - pokusa, N - nagroda, K - kara, F - frajer, P > N > K > F. Strategie : W - współpraca, Z - zdrada. Strategiami dominującymi dla gracza I i II jest zdrada (P > N, K > F). Wyznaczają one punkt równowagi globalnej. Przy założeniu braku możliwości kooperacji, interes własny każdego graczy dyktuje wybór strategii dominującej. Gdy kooperacja jest możliwa, obaj gracze mogą poprawić swoją wypłatę z K do N. Rozwiązanie (N, N) maksymalizujące wypłaty obu graczy jest niestabilne. Jeżeli np. gracz I zakłada, że po osiągnięciu porozumienia gracz II zachowa się lojalnie, będzie skłonny do odstępstwa - jego wypłata wzrośnie z N do P. Podobnie rozumuje gracz II, co bardzo utrudnia kooperację. Kooperacja jest tym trudniejsza, im większą wartość mają różnice P − N oraz N − F . W pierwszym przypadku pojawia się zachęta do zdrady, w drugim obawa przed byciem zdradzonym. Teoria gier zajmuje się tym, jak powinni zachowywać się racjonalnie postępujący gracze, natomiast psychologia behawioralna zajmuje się badaniem rzeczywistych zachowań ludzi. Badania te polegają na obserwacji w warunkach laboratoryjnych, jakie strategie obierają ludzie rozgrywający gry o różnych macierzach wypłat w zależności od struktury macierzy wypłat, dysponujący lub nie pełną informacją, mający nożliwość porozumiewania się, względnie pozbawieni tej możliwości. Eksperymenty dokonywane przez psychologów behawioralnych dowodzą, że możliwość wymiany informacji i powtarzalność gry sprzyja kooperacji. W przypadku rozgrywki jednokrotnej bez możliwości wymiany informacji badani wybierali strategie dominujące. W przypadku rozgrywki wielokrotnej bez możliwości wymiany informacji odpowiedzią na dokonanie odstępstwa przez jednego graczy było dokonanie odstępstwa przez drugiego gracza (kara). Świadomość kosztów nielojalności skłaniała po szeregu rozgrywkach każdego z graczy do wyboru strategii N. Zachowania kooperacyjne pojawiały się wcześniej i częściej, gdy badanym stworzono możliwość porozumiewania się. 4 J. Marcinkowski Badania operacyjne 5. Przykłady zastosowań 1. Ustalania ceny (duopol Carnota) Dylemat więźnia trafnie opisuje relacje zachodzące miedzy duopolistami będące wypadkową tendencji do rywalizacji i kooperacji. II Macierz wypłat opisuje zyski duopolistów wytwarzających W N ten sam wyrób. W ⎡(10, 10) (5, 12)⎤ I Strategie : W - wysoka cena, N - niska cena sprzedaży. ⎢ ⎥ N ⎣(12, 5) (7, 7)⎦ Jeżeli jeden z duopolistów zdecyduje się na sprzedaż po niskiej cenie a drugi po wysokiej, to pierwszy będzie osiągał niższy zysk jednostkowy, ale zwiększona sprzedaż spowoduje wzrost zysku. Zakłada się, że klient nie jest przywiązany do marki. Jeżeli obaj będą współpracować, to manipulując ceną będą realizować większe zyski niż w przypadku braku współpracy (przybierającej w skrajnym przypadku postać wojny cenowej). Przy braku możliwości porozumienia duopoliści wybiorą sprzedaż po niskiej cenie osiągając łączny zysk równy 7+7=14. Gdyby doszli do porozumienia, każdy z nich mógłby osiągnąć zysk o 3 większy, zysk łączny = 10+10 = 20 (różnica 20-14 jest zyskiem monopolisty). Strategia (W, W) nie jest stabilna w przeciwieństwie do strategii (N, N). Strategia (N, N) jest stabilna : gracz odstępujący od tej strategii przy założeniu, że drugi gracz pozostaje przy strategii N ponosi stratę : jego wyplata zmniejsza się z 7 do 5. Gracz nie dokonujący odstępstwa zyskuje : jego wypłata ulega zwiększeniu z 7 do 12. Kooperacji sprzyja : - łatwa kontrola przez konkurenta, - możliwość retorsji w przypadku braku kooperacji. W przypadku karteli macierz wypłat ma strukturę dylematu więźnia, co tłumaczy ich potencjalną niestabilność. 2. Walka o standard HDTV (High Definition Television) W macierzy podano wypłaty : przychody wyrażone w mld dol. w przypadku przyjęcia standardu emisji HDTV proponowanego przez firmy japońskie i amerykańskie. W przypadku ustalenia jednego standardu można oczekiwać dużych przychodów równych 150 mld dol. (100 + 50 = 60+90 = 150), co wynika z kompatybilności oferowanych urządzeń. Jeżeli nie dojdzie do porozumienia i będą obowiązywały dwa standardy, wówczas sprzedaż urządzeń będzie wyraźnie mniejsza, wynosząc 50 mld dol. (20 + 30). Jest oczywiste, że firmy amerykańskie nie przyjmą dobrowolnie standardu japońskiego i vice versa - dlatego w macierzy wypłat pojawia się element (0,0). II J I A J ⎡(100, 50) (30, 20)⎤ ⎢ (60, 90) ⎥⎦ A ⎣(0, 0) Gracze : I - firmy japońskie, II - firmy amerykańskie. Strategie : J - przyjąć standard japoński, A - przyjąć standard amerykański. Istnieją dwa stany równowagi w sensie Nasha : (100, 50) i (60, 90), ale przy każdym z nich korzyści są różnie rozłożone, co wymaga negocjacji - każda ze stron chce osiągnąć korzystniejszy dla siebie stan równowagi. Przy dużych różnicach korzyści każdej ze stron w stanach równowagi (100 i 60, 50 i 90) porozumienie może być nieosiągalne. Jeżeli jednak jedna ze stron narzuci swój standard i będzie w stanie opanować rynek - to druga strona musi się do niego dostosować. Istotnie, gdy np. firmy japońskie narzucą swój standard, to firmy amerykańskie akceptując go uzyskają przychód w wysokości 50 mld dol. Gdyby trwały przy swoim standardzie, to zostaną wyeliminowane z rynku. (co nie wynika z macierzy wypłat!). Macierz wypłat nie informuje bowiem o przebiegu rozgrywki. Sugeruje - fałszywie - że upór jest celowy, gdyż firmy amerykańskie nie rezygnując ze swojego standardu tracą 30 mld. dol. (50 - 20), a japońskie 70 mld dol. (100 - 30), co mogło by skłonić firmy japońskie do pertraktacji. Dlatego stosunki między firmami są wypadkową tendencji do rywalizacji i kooperacji. 5