Teoria gier – definiowana jako teoria podejmowania decyzji w

advertisement
TEORIA GIER
Teoria gier – definiowana jako teoria podejmowania decyzji w warunkach
interaktywnych (gry strategicznej) lub inaczej matematyczna teoria sytuacji
konfliktowych - została stworzona przez J. von Neumanna, który stwierdził, że
istota tej gry nie polega na próbie odgadnięcia intencji gracza, lecz na skrywaniu
własnych zamiarów. Podstawowym założeniem teorii gier jest racjonalne
działanie wszystkich podmiotów decyzyjnych (graczy). Podstawowymi
elementami każdej sytuacji, w której występuje zjawisko konkurencji są:
1. Gracze i ich posunięcia. Na rynku występuje przynajmniej dwóch
graczy i ich działania inwestycyjne, marketingowe oraz produkcyjno – cenowe
są wzajemnie uzależnione.
2. Wyniki i wypłaty. Działania wszystkich graczy określają wynik walki
konkurencyjnej (zwany wartością gry). Każdemu możliwemu wynikowi
odpowiada określona wypłata, która jest miarą stopnia osiągnięcia celu każdego
z rywali; najczęściej wyrażona pieniężnie, gdy mowa o przedsiębiorstwie, a w
wartościach użyteczności, gdy dotyczy konsumenta.
3. Reguły gry i cele graczy. Postępowaniem graczy rządzą formalne i
nieformalne reguły gry. Mogą to być przepisy prawne, powszechnie uznane
zasady konkurencji i nieuczciwe praktyki lub wrogie przejęcia, a także zasób
wiedzy analitycznej umożliwiającej śledzenie zachowań konkurencyjnych.
Punktem wyjścia w każdej analizie konkurencji, odwołującej się do
dorobku teorii gier, jest opis graczy, stosowanych przez nich strategii,
rozumianych jako plan działań, uwzględniający wszystkie ewentualności, w
jakich gracz może się znaleźć, oraz uzyskanych przez każdego z nich wypłat.
Walka konkurencyjna może mieć charakter jednorazowego posunięcia lub
wielu działań rozłożonych w czasie (konkurencja sekwencyjna i powtarzalna).
Gry mogą występować w wersji strategicznej i ekstensywnej.
Strategia dominująca to najlepsza możliwa reakcja na dowolną strategię
zastosowaną przez konkurenta. Jej logika nieuchronnie prowadzi do pogorszenia
wyniku, gdy gra ma charakter niekooperacyjny.
Historycznym przykładem gry niekooperacyjnej jest dylemat więźnia.
Gra dwuosobowa aresztowanych
Działania A
Działania B
Nie przyznawać się
Nie przyznawać się
Wsypać kompana
wsypać kompana
1 rok
1 rok
10 lat
0 lat
0 lat
10 lat
5 lat
5 lat
Paradoks więźnia występuje w ekonomii, gdy partnerzy skazani są na nieoptymalny
wynik. Ze względu na brak bodźców, żaden nie zamierza jednostronnie zmienić swojego
zachowania, chyba że w drodze podjęcia skoordynowanej współpracy, opartej na zaufaniu.
Ten rodzaj strategii można wykorzystać do wyjaśnienia oszustwa w porozumieniach
kartelowych.
Jeśliby dwa przedsiębiorstwa stworzyły kartel, dający zyski na poziomie 6 mln PLN i
dzielone po połowie, to uwzględniono by to w polu a (3, 3). Rywale zdają sobie sprawę, że
jeśli zwiększą sprzedaż, a konkurent pozostanie wierny umowie, to ich zyski wzrosną do 3,5
mln PLN, lecz uczciwym spadną do 1,5 mln PLN. Jeśli obaj będą oszukiwać, to zrealizują
zyski na poziomie 2 mln PLN.
F
F I R MA 2
I
oszustwo
R 1 oszustwo
M
uczciwość
uczciwość
2
2
3,5
1,5
1,5
3,5
3
3
A
Zysk kartelu jest maksymalny, gdy oba przedsiębiorstwa postępują zgodnie z umową
kartelową, a najniższy, gdy oba oszukują partnera. W tym najgorszym, pod względem
wyniku, polu (d) ukształtowała się równowaga, ponieważ partnerzy dostrzegają możliwość
zwiększenia swojego zysku przez nielojalność wobec siebie.
Strategie zapewniające równowagę (gry o wejście na rynek, udział w rynku)
powinny być stosowane, gdy konkurenci podejmują decyzje niezależnie od siebie (brak
zmowy). Wówczas są odzwierciedleniem „optymalnej” reakcji obu graczy, czyli pozwalają
one zmaksymalizować wielkość wypłaty każdego z nich w warunkach, określonych przez
wybór strategii, dokonany przez przeciwnika (równowaga Nasha). Inaczej, równowaga Nasha
oznacza taką parę strategii, że żaden z graczy nie ma motywacji do jednostronnego odejścia
od przyjętej strategii, biorąc pod uwagę strategię zastosowaną przez drugiego (dylemat
więźnia powyżej).
Najlepszym wynikiem, jakiego może oczekiwać gracz uczestniczący w grze o sumie
zerowej przeciwko jednakowo nastawionemu rywalowi, jest osiągnięcie stanu równowagi.
Gdyby któryś z graczy odstąpił od realizacji strategii prowadzącej do równowagi,
ograniczyłby wielkość własnych wypłat i pozwoliłby na zwiększenie wypłat rywala.
Ponieważ równowaga Nasha może się ukształtować w położeniu nieoptymalnym dla
podmiotów rynkowych, ekonomiści zwracają uwagę na strukturę rynku i konkurencję między
podmiotami, w której najkorzystniejsze rozwiązanie łączy się z wyczerpaniem potencjału
rynku w poszukiwaniu okazji do poprawy alokacji.
Równowaga Nasha jest uogólnieniem zarówno równowagi Cournota, jak i Bertranda,
które zachodzą, gdyż każde przedsiębiorstwo maksymalizuje zyski przy oczekiwanym
zachowaniu drugiego przedsiębiorstwa. Równowaga występuje, gdy oczekiwania
uczestników rynku potwierdza rzeczywistość. Jest to zbieżne z koncepcją Nasha o wzajemnej
zgodności optymalnych strategii.
Prostym przykładem gry, ilustrującej koncepcję równowagi Nasha, w której przynajmniej
dwaj gracze dokonują jednego, jednoczesnego ruchu, dotyczącego podjęcia jednej decyzji,
jest konkurencja między Hondą i Toyotą w Ameryce Północnej pod koniec lat 90. związana z
budową nowych zakładów produkcyjnych
Gra o udział w rynku między Toyotą i Hondą
Toy o t a
Budować nową wytwórnię
Budować nową wytwórnię
Honda
Nie budować
Nie budować
16
16
20
15
15
20
18
18
Wartości gry są podane w mln dolarów.
Z opisanego przykładu wynika, że jeśli gracze oczekują racjonalnego zachowania się
przeciwnika, to obaj „optymalizując” wybór, osiągają równowagę Nasha.
Przykładem gier z więcej niż jedną równowagą Nasha jest gra w tchórza, w której
dwóch nastolatków najeżdża na siebie samochodami po jednopasmowej drodze. Pierwszy,
który zjedzie z drogi zostaje tchórzem, drugi – bohaterem. Jeżeli obaj zjadą z drogi, to obaj
zostają tchórzami. Jeżeli żaden nie zjedzie – obaj lądują w szpitalu.
I
JANEK
R
zjechać
nie zjechać
E
Zjechać
1
1
1
2
K
nie zjechać
2
1
0
0
Nie występują strategie dominujące, lecz dwie równowagi Nasha. Ekonomistów
zawsze intrygowało poszukiwanie w życiu gospodarczym przykładów zachowań, które
odpowiadałyby postawom brawurowych graczy. Wydaje się, że najbardziej zbliżona jest
sytuacja monopolu naturalnego, w którym wysokie koszty wejścia i malejące koszty
przeciętne nie pozwalają realizować rentowności umożliwiającej funkcjonowanie na rynku
dwóch przedsiębiorstw.
Telewizja kablowa jest branżą wymagającą wysokich nakładów kapitału (kosztów
stałych) i relatywnie niskich kosztów krańcowych wraz z podłączeniem następnego
subskrybenta do odbioru programów. Zatem próg rentowności wymaga znacznej liczby
odbiorców (gospodarstw domowych). Ponieważ rynek telewizji satelitarnej w Wielkiej
Brytanii na przełomie lat 90. XX. wieku wydawał się potencjalnie ogromny, więc dwie firmy
postanowiły go podbić. Specyfikę sytuacji kształtowała odmienna, niekompatybilna
technologia obu konkurentów zniechęcająca odbiorców do opłacenia 200 funtów opłaty
wstępnej z ryzykiem braku możliwości wykorzystania sprzętu, gdyby zaszła konieczność
przestawienia się na odbiór proponowany przez inną firmę. Ponadto, firma Sky Television
planowała wziąć w leasing już krążącego w przestrzeni satelitę, a British Satellite
Broadcasting (BSB) zamierzała umieścić w przestrzeni własnego satelitę, co znacznie
podnosiło jej koszty.
W tabeli zamieszczono szacunek wartości zaktualizowanej wartości netto NPV za lata
1989 – 1999 uwzględniającej koszty satelitów, oprogramowania, reklamy, sprzedaży i
kosztów administracyjnych w warunkach dwóch strategii każdej z firm (wejścia na rynek i
pozostania poza nim).
B S B
S
wejść
K
Wejść
- 118
Y
nie wchodzić
0
nie wchodzić
- 747
673
0
137
0
0
Układ efektów (wypłat) wskazuje, że występuje podwójna równowaga Nasha. Teoria
gier nie podpowiada, która równowaga jest lepsza. To zależy od uwzględnienia dodatkowych
informacji (szczegółów). W opisywanym przypadku nie ma miejsca na rynku dla dwóch
przedsiębiorstw. Ze względu na opóźnienie techniczne w wystrzeleniu satelity i wysoki
poziom dziennych strat z tego tytułu doprowadziły do przejęcia BSB przez Sky. W rezultacie
od 1993 roku brytyjski rynek telewizji kablowej jest znacząco rentownym monopolem.
Występowanie kilku stanów równowagi (równowaga wielokrotna) to przypadek nawet
najprostszych negocjacji, których rezultatem może być dowolny podział zysków wskutek
przyjęcia konkretnego stanu równowagi.
Przykładem wojny cenowej może być model Bertranda, w którym konkurenci
uzgodnili cenę niższą od ceny monopolowej, ale wyższą od kosztu krańcowego
(MC < PB < Pm). Jeśli przy cenie wynoszącej np. 15 jp. popyt rynkowy
wynosiłby QX = 60, to każde z dwóch przedsiębiorstw sprzedając po 30 jednostek,
realizowałoby zysk na poziomie 150 jp. Gdyby jeden z konkurentów uznał, że może
powiększyć zysk poprzez zwiększenie udziału w rynku dzięki obniżce ceny do 14 jp.,
licząc na lojalność drugiego, to jego sprzedaż wzrosłaby do 40 jednostek, a zysk do
160 jp. Wówczas lojalny partner sprzedałby 25 jednostek, uzyskując jedynie 125 jp.
zysku. Przy jednoczesnym wyłamaniu się z umowy, oba przedsiębiorstwa sprzedają po
35 jednostek, z których zyski wynosi po 140 jp. dla każdego.
F
I
F I R MA 2
15
cena
14
R 1
15
150
150
125
160
M
14
160
125
140
140
A
Porozumienie odnośnie do ceny nie stanowiło równowagi Nasha, gdyż obie
firmy miały bodźce do wyłamania się z pierwotnych ustaleń. Z powyższego wynika
również, że wojna cenowa może trwać do zrównania się ceny z kosztem krańcowym,
ponieważ doprowadzi to do zaniku stymulatora obniżki ceny.
W wielu rzeczywistych sytuacjach rywale odpowiadają kontrposunięciami na
swoje działania. W grze sekwencyjnej uczestnicy wykonują swe ruchy po kolei
(drzewo gier).
Odstraszanie od wejścia
utrzymać cenę
4, 6
obniżyć cenę
- 4, 4
wejść
M
O
nie wchodzić 0, 12
wejść
6, 4
utrzymać cenę
O
nie wchodzić
12, 0
M
obniżyć cenę
wejść
4,- 4
nie wchodzić
9, 0
O
W przypadku gry rynkowej dwóch przedsiębiorstw dotyczącej decyzji o wysokości
cen homogenicznego produktu – zgodnie z prawem popytu – konsumenci wybiorą produkt o
niższej cenie. Na rysunku drzewa gry ekstensywnej zaznaczono zbiór informacyjny firmy 2,
co odzwierciedla strukturę informacyjną gry. Dwojakiego rodzaju decyzje cenowe (niska lub
wysoka cena) są podejmowane jednocześnie, więc zachowanie konkurenta nie jest znane w
momencie podejmowania decyzji przez rywala. Firma 1 ma dwie strategie S1 = {niska cena,
wysoka cena}. Firma 2 ma również dwie strategie S2 = {niska cena, wysoka cena}. Każda
może wybrać dowolną strategię, lecz wypłaty są im znane. Gra spełnia warunki gry o pełnej,
ale niedoskonałej informacji.
Firma 1
•
W
N
•
W
•
Firma 2
N
W
N
•
•
•
•
π 1   2 
  =  
π 2   2 
 0
 
3
3
 
 0
1
 
1
Alternatywą jednoczesności podejmowania decyzji jest ich sekwencyjność, czyli
zdynamizowanie tego procesu w czasie.
Jeśli reguły gry są takie same, jak w poprzednim przykładzie, a wszystkie zbiory
informacyjne są jednoelementowe i decyzje cenowe są podejmowane sekwencyjnie, to
zachowanie konkurenta jest znane w momencie podejmowania decyzji (pełna i doskonała
informacja).
Firma 1
•
W
N
•
W
•
Firma 2
N
W
N
•
•
•
•
π 1   2 
  =  
π 2   2 
 0
 
3
3
 
 0
1
 
1
Liczba strategii dostępnych każdej firmie jest niejednakowa: S1 = {niska cena,
wysoka cena}. Firma 2 ma po dwie strategie w zależności od strategii podjętej przez
konkurenta, czyli S2 = {niska cena, jeśli cena rywala jest niska, wysoka cena, jeśli
cena rywala jest niska, niska cena, jeśli cena rywala jest wysoka, wysoka cena, jeśli
cena rywala jest wysoka}.
Przykład konfliktu w Zatoce Świń (1962 rok).
CHRUSZCZOW
rozmieszczać rakiety
nie rozmieszczać rakiet
KENNEDY
nie robić nic
blokada
zniszczyć rakiety
CHRUSZCZOW
ustąpić
CHRUSZCZOW
odwet
ustąpić
odwet
A. Nie rozmieszczać rakiet
B. Rozmieścić rakiety. W przypadku jakiejkolwiek agresywnej reakcji Kennedy’ego
ustąpić
C. Rozmieścić rakiety. W przypadku blokady ustąpić, w przypadku zniszczenia rakiet
zastosować środki odwetowe
D. Rozmieścić rakiety. W przypadku blokady zastosować środki odwetowe, w
przypadku zniszczenia rakiet ustąpić
E. Rozmieścić rakiety. W przypadku jakiejkolwiek agresywnej reakcji Kennedy’ego
zastosować środki odwetowe.
A. Blinder przedstawił grę, której stronami są władze monetarne FED (niewybieralne,
kadencja 14 lat, a prezesów do emerytury) i politycy, którzy muszą starać się o reelekcję.
Pierwsi skłonni do polityki restrykcyjnej – drudzy do ekspansywnej. Celem gry jest
skłonienie przeciwnika do podjęcia decyzji, której nie chce podjąć z własnej woli. FED
preferuje nadwyżkę przychodów budżetu nad wydatkami rządowymi (brak deficytu).
Rezerwa Federalna
Bierność
3
Ekspansywność
1
9
Politycy
Bierność
Restrykcyjność
Restrykcyjność
2
4
6
5
6
8
Ekspansywność
4
7
5
8
7
1
9
3
2
Download