Teoria GIER

advertisement
TEORIA GIER
Czym jest gra?
Model matematyczny sytuacji konfliktowej

Warunki:
 Co najmniej dwóch graczy (gracz rozumiany jest jako
pojedynczy podmiot lub koalicja)
 Istnieją co najmniej dwie strategie czyli drogi postępowania
 W wyniku każdej gry każdy z graczy otrzymuje
pewną wygraną, której wysokość zależy od strategii
zastosowanych przez wszystkich graczy
Klasyfikacja gier
Szopa M. 2010. Teoria gier w negocjacjach i podejmowaniu decyzji
Teoria gier


Pierwszy raz pojawiła się w książce „The Theory of Games and
Economic Behavior” autorstwa Johna von Neumanna
(matematyk) oraz Oskara Morgensterna (ekonomista)
opublikowanej w połowie lat 50-tych
Szerokie zastosowania m.in. w:





Ekonomii
Naukach politycznych i społecznych
Biologii ewolucyjnej
Filozofii
Informatyce
https://www.pokersnowie.com/blog/2013/06/25/basic-guide-game-theory
Teoria gier


Dziedzina matematyki, która powstała w połowie lat 50-tych
XX wieku
Jest narzędziem do rozpatrywania modeli podejmowania
optymalnych decyzji, w sytuacjach z udziałem co najmniej
dwóch graczy





Podejmowanie decyzji w układach z wieloma uczestnikami, zwanymi
graczami lub agentami
Gracze nie znają strategii swoich przeciwników
Każdy z graczy ma swoje preferencje, które określają jego sposób
działania
Działania graczy muszą być zgodne z ustalonymi regułami
Nagrodą jest wypłata, którą każdy z graczy stara się maksymalizować
Z czego składa się gra?



Zbiór wszystkich graczy D = {1,2,3,…,Pn}
Zbiór reguł gry R
Zbiór możliwych strategii S



Zbiór możliwych wyników W to wartości funkcji określonych na
zbiorze strategii
Możliwe wypłaty ui(w) dla każdego gracza Pi i dla każdego
wyniku ze zbioru W



Zbiór możliwych ruchów jakie gracz może wykonać w trakcie gry
Korzyści jakie odniesie gracz, jeżeli uzyska w grze określony wynik
Mogą być różne dla różnych graczy
ui(w) nazywana jest funkcją wypłaty
Przykład gry
Wybieranie strony monety:

Dwóch graczy wybiera niezależnie orła lub reszkę i informuje o
swoim wyborze sędziego

Zbiór graczy D = {P1, P2}

Zbiór zasad R:


Gracz może wybrać jedną z dwóch opcji: orła lub reszkę

Wybór gracza musi być niezależny od wyboru drugiego gracza

Gracz 1 wygrywa jeżeli obydwu graczy wybierze tą samą stronę monety

Gracz 2 wygrywa jeżeli dwóch graczy wybierze różne strony monety
Zbiór strategii S:

Wybór orła lub reszki czyli S1=S2={orzeł, reszka}
Wybieranie strony monety


Zbiór możliwych wyników W:

W={wygrana, przegrana}

S1 x S2 = {(orzeł, orzeł), (orzeł, reszka), (reszka, orzeł), (reszka, reszka)}
Przykładowe wypłaty:
Wypłaty są równe:
 u1(wygrana) = 100
 u1(przegrana) = 0
 u2 (wygrana) = 100
 u2 (przegrana) = 0
A gdyby gracz 2 zyskiwał więcej na
wygranej gracza 1 niż swojej?
 u1(wygrana) = 100
 u1(przegrana) = 0
 u2 (wygrana) = 10
 u2 (przegrana) = 100
Gracze zawsze dążą do maksymalizacji swoich wyników
(maksymalnej wypłaty), ale niekoniecznie do „wygranej” w grze !
Typy gier w zależności od przebiegu
rozgrywki

Gracze mogą wykonywać swoje ruchy:



naprzemiennie (gry pozycyjne) – reprezentowane za pomocą drzewa
równocześnie (gry symultaniczne) – reprezentowany za pomocą
macierzy
W zależności od tego kiedy gracze dowiadują się o swoich
działaniach wyróżniamy gry:


z pełną informacją (wszystkie gry naprzemienne)
z niepełną informacją
Matematyczne modele gier

Drzewa:




Służą do reprezentacji gier
o naprzemiennej sekwencji ruchów
Pokazują kolejność działań
wykonywanych przez graczy
Reprezentują gry w postaci rozwiniętej - gracze w poszczególnych
ruchach są poinformowani na temat struktury gry
Macierze


Nie pokazują sekwencji ruchów, ale wypłaty otrzymywane na skutek
wybrania przez graczy określonej kombinacji strategii
Reprezentują gry w postaci strategicznej - gracze przy poszczególnych
ruchach nie są poinformowani na temat struktury gry
Wypłata



Wygrane (wypłaty) otrzymywane na skutek wybrania przez
graczy określonej kombinacji strategii
W modelach przedstawiamy wartości liczbowe, które rzadko
odpowiadają prawdziwym wypłatom, jakie gracze otrzymują
w trakcie rozgrywki
Wartości liczbowe symbolizujące wypłatę są pewnym
porządkiem, symbolem tego ile gracz zyskuje a ile traci
Strategia dominująca



Strategia, której zastosowanie przyniesie graczowi, taką
samą, a przynajmniej w jednym wypadku wyższą wypłatę, niż
zastosowanie jednej z pozostałych strategii
Macierz wypłat przykładowej gry:
Strategia
S1
S2
S3
S4
A
1
2
3
4
B
1
2
3
5
Strategią dominującą jest B, ponieważ nigdy nie przyniesie
gorszego wyniku niż A
Podział ze względu na sumę wypłat

Gra o sumie niezerowej:





Wielkość wygranej jednego z graczy nie jest bezwzględnie równa
przegranej drugiego
Każdy w graczy może coś zyskać na grze
Brak czystego konfliktu, może się pojawić jedynie niezgodność interesów
Gracze nie rywalizują o jedno dobro, współpraca czasami się opłaca
Gra o sumie stałej:



Wypłata jednego gracza może się zwiększyć jedynie kosztem wypłaty
innych graczy
Zawsze mamy do czynienia z konfliktem
Podtypem są gry o sumie zerowej
Gry o sumie zerowej

Suma wartości oczekiwanej wypłat dla wszystkich uczestników
dla każdego wyniku w grze wynosi 0




Strategia zwiększająca zysk jednego gracza zmniejsza wypłatę
pozostałych
Opisują pewien konflikt, rywalizację lub konkurencję
Gry antagonistyczne – są to gry o sumie zerowej, dla dwóch
graczy, w których gracze nie współpracują
Szachy jako przykład gry o sumie zerowej:
Czarne
wygrywają
Białe
wygrywają
U czarne
1
0
U białe
0
1
Dylemat wspólnych zasobów


Jako przykład gry o sumie niezerowej
Nazwa pochodzi od artykułu Garretta
Hardina z 1968 roku "Tragedy of the
Commons”
Przykład: Krowy na pastwisku



Jest 5 gospodarzy, każdy z nich ma dwie krowy, które może wypasać na
wspólnym pastwisku
Wypłata – ilość paszy zjedzona na pastwisku przez krowy gospodarza
Pastwisko ma ograniczoną powierzchnie – im więcej krów tym mniejsza
wydajność pastwiska
Dylemat wspólnych zasobów

Macierz wypłat dla przykładowego gospodarza:

Zakładamy, że każdy gospodarz jest identyczny
Ilość cudzych krów na pastwisku
Ilość
własnych
krów na
pastwisku



0
1
2
3
4
5
6
7
8
0
0
0
0
0
0
0
0
0
0
1
11
10
9
8
7
6
5
4
3
2
20
18
16
14
12
10
8
6
4
Każdemu z gospodarzy z osobna opłaca się najbardziej wypuścić dwie
krowy na pastwisko
Zakładając współpracę wszystkim gospodarzom opłaca się wypas
jednej krowy na gospodarza
Ile jednostek zarobi gospodarz, który się wyłamie i wypuści dwie
krowy?
Dylemat więźnia
Dwóch znanych policji złodziei
zostało zatrzymanych na
kradzieży. Podejrzani są o
poważniejsze przestępstwo,
jednak brak jest
wystarczających dowodów na
ich winę. Aresztowanych
umieszczono w osobnych
pomieszczeniach oraz
zaproponowano wyrok w
zawieszeniu za wsypanie
wspólnika i dostarczenie
dowodów na jego udział w
zbrodni.
Dylemat więźnia

Macierz wypłat:
Więzień B
Przyznaje się
Przyznaje się
Wiezień A



Zaprzecza zarzutom
Zaprzecza
zarzutom
5, 5
0 (A), 20(B)
20 (A), 0 (B)
1, 1
W przypadku, gdy obaj nie przyznają się do winy otrzymują niewielki
wyrok za kradzież na której zostali złapani (np. 1 rok)
Jeżeli jeden aresztowany obciąży drugiego, sam dostanie wyrok w
zawieszeniu, a drugi dostanie wyrok za poważniejsze przestępstwo (np.
20 lat)
Jeżeli oboje się przyznają otrzymują karę za kradzież i popełnienie
zbrodni, nieco złagodzoną ze względu na współpracę z wymiarem
sprawiedliwości (np. 5 lat)
Najlepsza strategia?


Co powinien zrobić więzień A? Która strategia jest dla niego
najbezpieczniejsza, a który rezultat (wygrana) byłby najlepszy?
Ile wynosi oczekiwana odsiadka w więzieniu dla gracza A, w
zależności od prawdopodobieństwa przypisywanego przez
jednego gracza poszczególnym decyzjom, których może
dokonać drugi gracz?

Gracz I zakłada, że prawdopodobieństwo przyznania się jego
samego (P(I)) oraz gracza II (P(II)) jest równe czyli wynosi 0,5
 P(I) * P(II) * wypłata dla gracza I + (1-P(I)) * P(II) * wypłata dla
gracza I P(I) * (1-P(II)) * wypłata dla gracza I + (1-P(I)) * (1P(II)) * wypłata dla gracza I = 0,5 * 05 * 5 + 0.5 * 0.5 * 20 +
0.5 * 0.5 * 0 + 0.5 * 0.5 * 1 = 6,5
Równowaga Nasha
Szczególny stan w którym każdy uczestnik wybiera najlepszą
z możliwych strategii. Strategia ta jest najlepszą możliwą
odpowiedzią na zachowanie innych graczy.
John Forbes Nash (1928-2015)
Amerykański matematyk i ekonomista
Prowadził badania nad teorią gier
Był noblistą w dziedzinie ekonomii
Został sportretowany w filmie „Piękny umysł”
Strategia równowagi

Stan równowagi wg Nasha



Taki wybór strategii dokonany przez graczy, że dowolna zmiana
strategii przez jednego gracza (przy równoczesnym braku zmiany
strategii przez pozostałych graczy) nie spowoduje wzrostu wygranej
tego gracza
Jeżeli gra posiada tylko jedną strategię równowagową Nasha to jest to
jedyne rozwiązanie tej gry
Często gra ma więcej niż jedną strategie równowagową
Teoria gier w naukach przyrodniczych
Ewolucyjna teoria gier





Poszczególne gatunki i/lub geny traktowane są jako gracze
Reguły gry określa selekcja naturalna
Przy zadanym środowisku każdy osobnik danego gatunku ma
tym większą wypłatę, im większą liczbę potomków spłodzi
dzięki swoim cechom
Dostosowanie jakie warunkuje dana strategia może być
zależne od jej częstości występowania w populacji
Nie rozważamy już osobników wybierających określone
strategie, ani równowagowych położeń pojedynczych gier, ale
grę poszczególnych strategii grających przeciwko sobie
Gra gołąb-jastrząb


Populacja zwierząt w której
dochodzi do konkurencji
między samcami w okresie
godowym
Typy zachowań samców nazywamy strategiami



Przyjmujemy, że strategie są dziedziczne
Przyjęcia danej strategii z punktu widzenia zasady maksymalizacji
dostosowania, może być: korzystne, niekorzystne lub neutralne
Dla uproszczenia przyjmiemy, że dostępne są tylko dwa typy
zachowań: gołąb oraz jastrząb
Gra gołąb-jastrząb
Strategie:

Gołąb (G) - strategia wycofania się



Unika walki niezależnie od okoliczności
Ogranicza się do demonstracji siły
Jastrząb (J) - strategia agresji


Zawsze dąży do walki
W przypadku przeciwnika jastrzębia walczy do końca
Które wzorce zachowań powinny być częściej spotykane w
populacji i od czego to zależy?
Gra gołąb-jastrząb



Rezultat – wygrana lub przegrana, pomijamy możliwość remisu
Korzyścią jest wzrost dostosowania
wzrost sukcesu
reprodukcyjnego
wzrost wielkości terytorium
Korzyść jest zmienną losową określoną na dwuelementowym
zbiorze zdarzeń elementarnych ΩG,J

Korzyść (K) lub strata (korzyść ujemna) wyraża ilościowo wielkość
wygranej i zależy od tego, którzy partnerzy wchodzą w konflikt
Gra gołąb-jastrząb

Macierz wypłat
 Osobnik, który wygrywa zyskuje α
 Osobnik zraniony traci γ
Średnie wygrane dla
gracza 1 względem 2:
Macierz wypłat jest symetryczna dla obydwu graczy!
Gra gołąb-jastrząb
Strategia a jej częstość

W populacji występuje frakcja p stosująca strategię jastrząb
(J) oraz frakcja 1-p stosująca strategie gołąb (G)



Prawdopodobieństwo spotkania J = p
Prawdopodobieństwo spotkania G = 1- p
Zmienną losową Sj oznaczamy przyrost
dostosowania dla stosującego
zawsze strategię J, natomiast SG
SJ
przyrost stosującego zawsze
SG
strategie G
p
1-p
Gra gołąb-jastrząb


Wartość oczekiwana zmiennej SJ
 Średni wzrost dostosowania dla stosującego zawsze
strategie J
Wartość oczekiwana zmiennej SG
 Średni wzrost dostosowania dla stosującego zawsze
strategie G
Gra gołąb-jastrząb

Jeżeli wielkość straty przewyższa możliwy zysk czyli α < γ,
korzyści ze stosowania obydwu strategii zrównają się kiedy

Jeżeli
to D(J,p) < D( G, 1-p) czyli warto stosować G

Jeżeli
to D(J,p) > D( G, 1-p) czyli warto stosować J

Po pewnym czasie powinna ustalić się równowaga osobników
stosujących strategie G i J
Stan równowagi
http://www.indiana.edu/~curtweb/S318/S318/lecturexi/lecturexi.html
Gra gołąb-jastrząb


Proporcja jastrzębi będzie tym mniejsza im więcej można
stracić w walce w stosunku do zysku
Inna interpretacja?


Strategia mieszana – zakładamy, że osobnik jest nosicielem genów,
które z prawdopodobieństwem p powodują przyjęcie strategii J,
oraz z prawdopodobieństwem 1-p przyjęcie strategii G
Strategie J i G nazywamy czystymi
Strategia ewolucyjnie stabilna (ESS)
„... definiuje się jako taką
strategię, której od momentu
gdy zostanie przyjęta przez
większość członków populacji,
nie jest w stanie wyprzeć żadna
inna strategia alternatywna”
Richard Dawkins
Strategia ewolucyjnie stabilna (ESS)



Pojęcie wprowadzone przez
Maynarda Smitha
Teoria ta rozważa grę poszczególnych
strategii grających przeciwko sobie
Zbiór strategii wziętych w określonych proporcjach jest
strategią ewolucyjnie stabilną (ESS) jeśli:


żaden osobnik nie może zwiększyć swojego dostosowania
(rozrodczego) poprzez zmianę strategii na inną
żaden mutant korzystający z innej strategii nie ma szans dokonania
„inwazji” na badaną populację
Strategia ewolucyjnie stabilna (ESS)

W grze gołąb-jastrząb strategia ewolucyjnie stabilna to:


Strategia czysta J – jeżeli wartość wygranej bardzo przewyższa
koszt ewentualnej przegranej
Strategia mieszana – Jeżeli straty w razie przegranej
przewyższają maksymalny zysk, bardziej opłaca się stosować
strategie mieszaną, czyli wymiennie strategie czyste G i J
Inne dostępne strategie w grze gołąbjastrząb


Pozer (chojrak) - na początku przystępuje do ataku, ale jeżeli
przeciwnik się nie przestraszy, ucieka. W starciu z jastrzębiem
zachowuje się więc jak gołąb, w starciu z gołębiem jak
jastrząb
Odwetowiec (mściciel) - na początku walki zachowuje się jak
gołąb. Jeżeli przeciwnik zaatakuje, odpłaca mu tym samym.
W starciu z jastrzębiem zachowuje się jak jastrząb, w starciu z
gołębiem jak gołąb
Wirusy DI




Podczas infekcji produkty wytwarzane przez zainfekowaną komórkę są
wspólne dla wszystkich wirusów
Wirusy DI (defective-interfering) nie posiadają genów
odpowiadających za syntezę części nowych produktów, zamiast tego
korzystają z tego co wytworzyły inne wirusy
Zakłada się, że przy niskiej frekwencji wirusy DI będą lepiej
dostosowane i będą zwiększały swoją frekwencję do pewnej granicy
Równowaga pomiędzy „zwykłymi” wirusami oraz wirusami DI jest
bardzo często obserwowana w przyrodzie, szczególnie u wirusów
roślinnych
Teoria gier i bakteriofagi



Jako przykład wykorzystano Bakteriofaga ɸ6 z rodziny
Cystoviridae (Turner, P. E. A Virus Booster for Game Theory,
ASM news)
Obserwuje się bardzo dużo spontanicznych mutacji (od 10-3
do 10-5 na replikacje) przez co jest bardzo dobrym modelem
Zależności obserwowane u tych bakteriofagów tłumaczono z
poprzez dylemat więźnia z teorii gier
Dziękuję za uwagę
„Cała ta opowieść o jastrzębiach i gołębiach jest oczywiście
naiwnie prosta. Jest modelem, czymś co w rzeczywistości nie
występuje w przyrodzie, ale ma nam pomóc w zrozumieniu
zjawisk, które naprawdę w naturze istnieją.”
Richard Dawkins
Literatura







Wrzosek D. 2011. Matematyka dla biologów.
Kostecki R. Wprowadzenie do teorii gier. Materiały dostępne na stronie:
http://www.fuw.edu.pl/~kostecki/teoria_gier.pdf
Nogal P. Dylemat więźnia jako przykład wykorzystania teorii gier.
http://jmf.wzr.pl/pim/2012_4_2_7.pdf
Sigmund K., Nowak M.A. 2014. Evolutionary game theory. Current Biology,
Vol 9 No 14.
Turner P.E. 2003. A Virus Booster for Game Theory.
Roztański T. 2003.
http://coin.wne.uw.edu.pl/tkopczewski/MIKROsite/teoria_gier_ksiazka/ch
01.html
Wybrane schematy i rysunki: http://www.britannica.com/topic/gametheory
Download