Teoria GIER

advertisement
TEORIA GIER
Biomatematyka
Dr Wioleta Drobik-Czwarno
Czym jest gra?
Model matematyczny sytuacji konfliktowej

Warunki:
 Co najmniej dwóch graczy (gracz rozumiany jest jako
pojedynczy podmiot lub koalicja)
 Istnieją co najmniej dwie strategie czyli drogi postępowania
 W wyniku każdej gry każdy z graczy otrzymuje
pewną wygraną, której wysokość zależy od strategii
zastosowanych przez wszystkich graczy
Klasyfikacja gier
Szopa M. 2010. Teoria gier w negocjacjach i podejmowaniu decyzji
Teoria gier


Pierwszy raz pojawiła się w książce „The Theory of Games and
Economic Behavior” autorstwa Johna von Neumanna
(matematyk) oraz Oskara Morgensterna (ekonomista)
opublikowanej w połowie lat 50-tych
Szerokie zastosowania m.in. w:





Ekonomii
Naukach politycznych i społecznych
Biologii ewolucyjnej
Filozofii
Informatyce
https://www.pokersnowie.com/blog/2013/06/25/basic-guide-game-theory
Teoria gier


Dziedzina matematyki, która powstała w połowie lat 50-tych
XX wieku
Jest narzędziem do rozpatrywania modeli podejmowania
optymalnych decyzji, w sytuacjach z udziałem co najmniej
dwóch graczy





Podejmowanie decyzji w układach z wieloma uczestnikami, zwanymi
graczami lub agentami
Gracze nie znają strategii swoich przeciwników
Każdy z graczy ma swoje preferencje, które określają jego sposób
działania
Działania graczy muszą być zgodne z ustalonymi regułami
Nagrodą jest wypłata, którą każdy z graczy stara się maksymalizować
Z czego składa się gra?



Zbiór wszystkich graczy D = {1,2,3,…,Pn}
Zbiór reguł gry R
Zbiór możliwych strategii S



Zbiór możliwych wyników W to wartości funkcji określonych na
zbiorze strategii
Możliwe wypłaty ui(w) dla każdego gracza Pi i dla każdego
wyniku ze zbioru W



Zbiór możliwych ruchów jakie gracz może wykonać w trakcie gry
Korzyści jakie odniesie gracz, jeżeli uzyska w grze określony wynik
Mogą być różne dla różnych graczy
ui(w) nazywana jest funkcją wypłaty
Przykład gry
Wybieranie strony monety:

Dwóch graczy wybiera niezależnie orła lub reszkę i informuje o
swoim wyborze sędziego

Zbiór graczy D = {P1, P2}

Zbiór zasad R:


Gracz może wybrać jedną z dwóch opcji: orła lub reszkę

Wybór gracza musi być niezależny od wyboru drugiego gracza

Gracz 1 wygrywa jeżeli obydwu graczy wybierze tą samą stronę monety

Gracz 2 wygrywa jeżeli dwóch graczy wybierze różne strony monety
Zbiór strategii S:

Wybór orła lub reszki czyli S1=S2={orzeł, reszka}
Wybieranie strony monety


Zbiór możliwych wyników W:

W={wygrana, przegrana}

S1 x S2 = {(orzeł, orzeł), (orzeł, reszka), (reszka, orzeł), (reszka, reszka)}
Przykładowe wypłaty:
Wypłaty są równe:
 u1(wygrana) = 100
 u1(przegrana) = 0
 u2 (wygrana) = 100
 u2 (przegrana) = 0
A gdyby gracz 2 zyskiwał więcej na
wygranej gracza 1 niż swojej?
 u1(wygrana) = 100
 u1(przegrana) = 0
 u2 (wygrana) = 50
 u2 (przegrana) = 100
Gracze zawsze dążą do maksymalizacji swoich wyników
(maksymalnej wypłaty), ale niekoniecznie do „wygranej” w grze
Typy gier w zależności od przebiegu
rozgrywki

Gracze mogą wykonywać swoje ruchy:



naprzemiennie (gry pozycyjne) – reprezentowane za pomocą drzewa
równocześnie (gry symultaniczne) – reprezentowany za pomocą
macierzy
W zależności od tego kiedy gracze dowiadują się o swoich
działaniach wyróżniamy gry:


z pełną informacją (wszystkie gry naprzemienne)
z niepełną informacją
Matematyczne modele gier

Drzewa:




Służą do reprezentacji gier
o naprzemiennej sekwencji ruchów
Pokazują kolejność działań
wykonywanych przez graczy
Reprezentują gry w postaci rozwiniętej - gracze w poszczególnych
ruchach są poinformowani na temat struktury gry
Macierze


Nie pokazują sekwencji ruchów, ale wypłaty otrzymywane na skutek
wybrania przez graczy określonej kombinacji strategii
Reprezentują gry w postaci strategicznej - gracze przy poszczególnych
ruchach nie są poinformowani na temat struktury gry
Wypłata



Wygrane (wypłaty) otrzymywane na skutek wybrania przez
graczy określonej kombinacji strategii
W modelach przedstawiamy wartości liczbowe, które rzadko
odpowiadają prawdziwym wypłatom, jakie gracze otrzymują
w trakcie rozgrywki
Wartości liczbowe symbolizujące wypłatę są pewnym
porządkiem, symbolem tego ile gracz zyskuje a ile traci
Strategia dominująca



Strategia, której zastosowanie przyniesie graczowi, taką
samą, a przynajmniej w jednym wypadku wyższą wypłatę, niż
zastosowanie jednej z pozostałych strategii
Macierz wypłat przykładowej gry:
Strategia
S1
S2
S3
S4
A
1
2
3
4
B
1
2
3
5
Strategią dominującą jest B, ponieważ nigdy nie przyniesie
gorszego wyniku niż A
Podział ze względu na sumę wypłat

Gra o sumie niezerowej:





Wielkość wygranej jednego z graczy nie jest bezwzględnie równa
przegranej drugiego
Każdy w graczy może coś zyskać na grze
Brak czystego konfliktu, może się pojawić jedynie niezgodność interesów
Gracze nie rywalizują o jedno dobro, współpraca czasami się opłaca
Gra o sumie stałej:



Wypłata jednego gracza może się zwiększyć jedynie kosztem wypłaty
innych graczy
Zawsze mamy do czynienia z konfliktem
Podtypem są gry o sumie zerowej
Gry o sumie zerowej

Suma wartości oczekiwanej wypłat dla wszystkich uczestników
dla każdego wyniku w grze wynosi 0




Strategia zwiększająca zysk jednego gracza zmniejsza wypłatę
pozostałych
Opisują pewien konflikt, rywalizację lub konkurencję
Gry antagonistyczne – są to gry o sumie zerowej, dla dwóch
graczy, w których gracze nie współpracują
Szachy jako przykład gry o sumie zerowej:
Czarne
wygrywają
Białe
wygrywają
U czarne
1
0
U białe
0
1
Dylemat wspólnych zasobów


Jako przykład gry o sumie niezerowej
Nazwa pochodzi od artykułu Garretta
Hardina z 1968 roku "Tragedy of the
Commons”
Przykład: Krowy na pastwisku



Jest 5 gospodarzy, każdy z nich ma dwie krowy, które może wypasać na
wspólnym pastwisku
Wypłata – ilość paszy zjedzona na pastwisku przez krowy gospodarza
Pastwisko ma ograniczoną powierzchnie – im więcej krów tym mniejsza
wydajność pastwiska
Dylemat wspólnych zasobów

Macierz wypłat dla przykładowego gospodarza:

Zakładamy, że każdy gospodarz jest identyczny
Ilość cudzych krów na pastwisku
Ilość
własnych
krów na
pastwisku



0
1
2
3
4
5
6
7
8
0
0
0
0
0
0
0
0
0
0
1
11
10
9
8
7
6
5
4
3
2
20
18
16
14
12
10
8
6
4
Każdemu z gospodarzy z osobna opłaca się najbardziej wypuścić dwie
krowy na pastwisko
Zakładając współpracę wszystkim gospodarzom opłaca się wypas
jednej krowy na gospodarza
Ile jednostek zarobi gospodarz, który się wyłamie i wypuści dwie
krowy?
Dylemat więźnia
Dwóch znanych policji złodziei
zostało zatrzymanych na
drobnej kradzieży. Podejrzani
są o poważniejsze
przestępstwo, jednak brak jest
wystarczających dowodów na
ich winę. Aresztowanych
umieszczono w osobnych
pomieszczeniach oraz
zaproponowano wyrok w
zawieszeniu za wydanie
wspólnika i dostarczenie
dowodów na jego udział w
zbrodni.
Dylemat więźnia

Macierz wypłat:
Więzień B
Przyznaje się
Przyznaje się
Wiezień A



Zaprzecza zarzutom
Zaprzecza
zarzutom
5, 5
0 (A), 20(B)
20 (A), 0 (B)
1, 1
W przypadku, gdy obaj nie przyznają się do winy otrzymują niewielki
wyrok za kradzież na której zostali złapani (np. 1 rok)
Jeżeli jeden aresztowany obciąży drugiego, sam dostanie wyrok w
zawieszeniu, a drugi dostanie wyrok za poważniejsze przestępstwo (np.
20 lat)
Jeżeli oboje się przyznają otrzymują karę za kradzież i popełnienie
zbrodni, nieco złagodzoną ze względu na współpracę z wymiarem
sprawiedliwości (np. 5 lat)
Najlepsza strategia?


Co powinien zrobić więzień A? Która strategia jest dla niego
najbezpieczniejsza, a który rezultat (wygrana) byłby najlepszy?
Ile wynosi oczekiwana odsiadka w więzieniu dla gracza A, w
zależności od prawdopodobieństwa przypisywanego przez
jednego gracza poszczególnym decyzjom, których może
dokonać drugi gracz?

Gracz I zakłada, że prawdopodobieństwo przyznania się jego
samego (P(I)) oraz gracza II (P(II)) jest równe czyli wynosi 0,5
 P(I) * P(II) * wypłata dla gracza I + (1-P(I)) * P(II) * wypłata dla
gracza I + P(I) * (1-P(II)) * wypłata dla gracza I + (1-P(I)) * (1P(II)) * wypłata dla gracza I = 0,5 * 05 * 5 + 0.5 * 0.5 * 20 +
0.5 * 0.5 * 0 + 0.5 * 0.5 * 1 = 6,5
Równowaga Nasha
Szczególny stan w którym każdy uczestnik wybiera najlepszą
z możliwych strategii. Strategia ta jest najlepszą możliwą
odpowiedzią na zachowanie innych graczy.
John Forbes Nash (1928-2015)
Amerykański matematyk i ekonomista
Prowadził badania nad teorią gier
Był noblistą w dziedzinie ekonomii
Został sportretowany w filmie „Piękny umysł”
Strategia równowagi

Stan równowagi wg Nasha



Taki wybór strategii dokonany przez graczy, że dowolna zmiana
strategii przez jednego gracza (przy równoczesnym braku zmiany
strategii przez pozostałych graczy) nie spowoduje wzrostu wygranej
tego gracza
Jeżeli gra posiada tylko jedną strategię równowagową Nasha to jest to
jedyne rozwiązanie tej gry
Często gra ma więcej niż jedną strategie równowagową
Teoria gier a ewolucja
Ewolucyjna teoria gier





Poszczególne gatunki i/lub geny traktowane są jako gracze
Reguły gry określa selekcja naturalna
Przy zadanym środowisku każdy osobnik danego gatunku ma
tym większą wypłatę, im większą liczbę potomków spłodzi
dzięki swoim cechom
Dostosowanie jakie warunkuje dana strategia może być
zależne od jej częstości występowania w populacji
Nie rozważamy już osobników wybierających określone
strategie, ani równowagowych położeń pojedynczych gier, ale
grę poszczególnych strategii grających przeciwko sobie
Gra gołąb-jastrząb


Populacja zwierząt w której
dochodzi do konkurencji
między samcami w okresie
godowym
Typy zachowań samców nazywamy strategiami



Przyjmujemy, że strategie są dziedziczne
Przyjęcia danej strategii z punktu widzenia zasady maksymalizacji
dostosowania, może być: korzystne, niekorzystne lub neutralne
Dla uproszczenia przyjmiemy, że dostępne są tylko dwa typy
zachowań: gołąb oraz jastrząb
Gra gołąb-jastrząb
Strategie:

Gołąb (G) - strategia wycofania się



Unika walki niezależnie od okoliczności
Ogranicza się do demonstracji siły
Jastrząb (J) - strategia agresji


Zawsze dąży do walki
W przypadku przeciwnika jastrzębia walczy do końca
Które wzorce zachowań powinny być częściej spotykane w
populacji i od czego to zależy?
Gra gołąb-jastrząb



Rezultat – wygrana lub przegrana, pomijamy możliwość remisu
Korzyścią jest wzrost dostosowania
wzrost sukcesu
reprodukcyjnego
wzrost liczby potomstwa oraz
zasobów środowiska
Korzyść jest zmienną losową określoną na dwuelementowym
zbiorze zdarzeń elementarnych ΩG,J

Korzyść (K) lub strata (korzyść ujemna) wyraża ilościowo wielkość
wygranej i zależy od tego, którzy partnerzy wchodzą w konflikt
Gra gołąb-jastrząb

Macierz wypłat
 Osobnik, który wygrywa zyskuje α
 Osobnik zraniony traci γ
Średnie wygrane dla gracza
1 względem gracza 2:
Macierz wypłat jest symetryczna dla obydwu graczy!
Gra gołąb-jastrząb
Strategia a jej częstość

W populacji występuje frakcja p stosująca strategię jastrząb
(J) oraz frakcja 1-p stosująca strategie gołębia (G)



Prawdopodobieństwo spotkania J = p
Prawdopodobieństwo spotkania G = 1- p
Zmienną losową Sj oznaczamy przyrost
dostosowania dla stosującego
zawsze strategię J, natomiast SG
SJ
przyrost stosującego zawsze
SG
strategie G
p
1-p
Gra gołąb-jastrząb


Wartość oczekiwana zmiennej SJ
 Średni wzrost dostosowania dla stosującego zawsze
strategie J
Wartość oczekiwana zmiennej SG
 Średni wzrost dostosowania dla stosującego zawsze
strategie G
Gra gołąb-jastrząb

Jeżeli wielkość straty przewyższa możliwy zysk czyli α < γ,
korzyści ze stosowania obydwu strategii zrównają się kiedy

Jeżeli
to D(J,p) < D( G, 1-p) czyli warto stosować G

Jeżeli
to D(J,p) > D( G, 1-p) czyli warto stosować J

Po pewnym czasie powinna ustalić się równowaga osobników
stosujących strategie G i J
Stan równowagi
http://www.indiana.edu/~curtweb/S318/S318/lecturexi/lecturexi.html
Gra gołąb-jastrząb


Proporcja jastrzębi będzie tym mniejsza im więcej można
stracić w walce w stosunku do zysku
Inna interpretacja?


Strategia mieszana – zakładamy, że osobnik jest nosicielem genów,
które z prawdopodobieństwem p powodują przyjęcie strategii J,
oraz z prawdopodobieństwem 1-p przyjęcie strategii G
Strategie J i G nazywamy czystymi
Strategia ewolucyjnie stabilna (ESS)
„... definiuje się jako taką
strategię, której od momentu
gdy zostanie przyjęta przez
większość członków populacji,
nie jest w stanie wyprzeć żadna
inna strategia alternatywna”
Richard Dawkins
Strategia ewolucyjnie stabilna (ESS)



Pojęcie wprowadzone przez
Maynarda Smitha
Teoria ta rozważa grę poszczególnych
strategii grających przeciwko sobie
Zbiór strategii wziętych w określonych proporcjach jest
strategią ewolucyjnie stabilną (ESS) jeśli:


żaden osobnik nie może zwiększyć swojego dostosowania
(rozrodczego) poprzez zmianę strategii na inną
żaden mutant korzystający z innej strategii nie ma szans dokonania
„inwazji” na badaną populację
Strategia ewolucyjnie stabilna (ESS)

W grze gołąb-jastrząb strategia ewolucyjnie stabilna to:


Strategia czysta J – jeżeli wartość wygranej bardzo przewyższa
koszt ewentualnej przegranej
Strategia mieszana – Jeżeli straty w razie przegranej
przewyższają maksymalny zysk, bardziej opłaca się stosować
strategie mieszaną, czyli wymiennie strategie czyste G i J
Inne strategie w grze gołąb-jastrząb


Pozer (chojrak) - na początku
przystępuje do ataku, ale jeżeli
przeciwnik się nie przestraszy, ucieka. W
starciu z jastrzębiem zachowuje się więc
jak gołąb, w starciu z gołębiem jak
jastrząb
Odwetowiec (mściciel) - na początku
walki zachowuje się jak gołąb. Jeżeli
przeciwnik zaatakuje, odpłaca mu tym
samym. W starciu z jastrzębiem
zachowuje się jak jastrząb, w starciu z
gołębiem jak gołąb
http://www.toonpool.com/cartoons/Revenge%20of%20worms_94202
Teoria gier i wirusy


W trakcie replikacji w komórce gospodarza, białka wirusa
znajdują się w cytoplazmie (lub jądrze komórkowym) i żaden
konkretny wirus nie ma do nich wyłącznego dostępu
Przypomina to dzielenie magazynu i może prowadzić do
różnych strategii, kooperacji lub wyłącznie prób
maksymalizacji własnej korzyści
Który wirus dostanie
którą część, jeżeli do
komórki dostanie się
więcej niż 1?
https://www.quora.com/Vi
rology-How-does-a-virusreplicate
Teoria gier i wirusy

Strategie:
 Wirus może tworzyć (za pośrednictwem komórki) duże ilości
produktu, wtedy przyjmuje strategie kooperacji
 Wirus może tworzyć (za pośrednictwem komórki) małe ilości
produktu i korzystać z tego co wytworzą inne wirusy, wtedy
dąży do maksymalizacji wyłącznie własnych korzyści
 Co opłaca się bardziej w kontekście skuteczności infekcji, a
co dla pojedyńczego wirusa?
Model macierzy wypłat:
Turner, 2003
Teoria gier i wirusy

Strategia maksymalizacji własnych korzyści została przyjęta
przez wirusy DI (ang. defective-interfering particles)

Wirusy DI nie posiadają genów odpowiadających za syntezę części
nowych produktów, zamiast tego korzystają z tego co wytworzyły inne
wirusy

Zakłada się, że przy niskiej frekwencji wirusy DI będą lepiej
dostosowane i będą zwiększały swoją frekwencję do pewnej granicy

Równowaga pomiędzy „zwykłymi” wirusami oraz wirusami DI jest
bardzo często obserwowana w przyrodzie, szczególnie u wirusów
roślinnych
Wirus DI i VSV

Wirus pęcherzykowatego zapalenia jamy ustnej (ang. vesicular
stomatitis virus -VSV) :



należy do rodziny Rhabdoviridae
jest patogenem ssaków kopytnych, w tym zwierząt hodowlanych takich
jak: konie, bydło, świnie
posiada genom w postaci pojedynczej nici RNA o ujemnej polarności
(ssRNA(-)) złożonej z pięciu nie nakładających się na siebie genów
kodujących białka wirusowe
Źródło: Tomczyk T., Orzechowska B. Zastosowanie wirusa pęcherzykowatego zapalenia jamy ustnej (VSV) jako wektora
szczepionek przeciwwirusowych. Postepy Hig Med Dosw 67: 1345-1358.
Wirus DI i VSV
Źródło: Turner, 2003, za Chao et al., Q. Rev. Biol. 75:261–275, 2000
Wirus DI i VSV
Przykładowa macierz wypłat:
Gracze przyjmują strategie
kooperacji (populacja złożona
wyłącznie z pomocników)
Wypłata dla gracza, który
oszukuje (DI), podczas gdy
drugi z graczy (pomocnik)
przyjmuje strategie kooperacji
Wypłata dla gracza
(pomocnika), który
przyjmuje strategie
kooperacji podczas gdy
drugi gracz oszukuje (DI)
Wypłata dla graczy jeżeli
wszyscy oszukują (w populacji są
jedynie wirusy DI)
Wirus DI i VSV



Wirusy DI po pojawieniu się w populacji zwykłych wirusów
mają przewagę ewolucyjną, ponieważ ich replikacja jest
bardziej wydajna i są otoczone pomocnikami, których białka
mogą wykorzystywać
szybko zwiększą swoją
frekwencję.
Wirusy DI są zależne od właściwych form wirusa (nie
posiadają sekwencji kodującej białka) i nie mogą istnieć bez
pomocników
w miarę zwiększania się ich
frekwencji ich dostosowanie będzie malało
Najlepszą strategią dla wirusów DI jest
populacja polimorficzna, równowaga
pomiędzy cząstkami DI a pomocnikami
Turner, 2003
Teoria gier i bakteriofagi

Baketriofagi



Wirusy atakujące bakterie (9 rodzin) lub archeony (2 rodziny)
Materiał genetyczny: DNA lub RNA
Bakteriofag ɸ6 z rodziny Cystoviridae



Materiał genetyczny: dsRNA
Wykorzystanie dylematu
więźnia z teorii gier do
analizy interakcji między
wirusami (Chao i Turner, 1999)
po raz pierwszy.
Obserwuje się bardzo dużo
spontanicznych mutacji
(rzędu od 10-3 do 10-5
na replikacje)
Viral Zone 2010, Swiss Institute of Bioinformatics
Teoria gier i bakteriofagi

Zmutowany bakteriofag ɸH2 w porównaniu z ɸ6



Dostosowanie ɸH2 jest zależne od frekwencji
W obecności ɸH2 zredukowane jest łączne dostosowanie całej populacji
Bakteriofagi, które oszukują, będą się rozprzestrzeniać w
populacji, ponieważ rzadko pojawiający się kooperatorzy będą
mieli słabsze dostosowanie w starciu z nimi
P. Turner and L. Chao, Nature 398:441–443, 1999
Turner, 2003
Literatura







Wrzosek D. 2011. Matematyka dla biologów. Wydawnictwo UW.
Kostecki R. Wprowadzenie do teorii gier. Materiały dostępne na stronie:
http://www.fuw.edu.pl/~kostecki/teoria_gier.pdf
Nogal P. Dylemat więźnia jako przykład wykorzystania teorii gier.
http://jmf.wzr.pl/pim/2012_4_2_7.pdf
Sigmund K., Nowak M.A. 2014. Evolutionary game theory. Current Biology,
Vol 9 No 14.
Turner P.E. 2003. A Virus Booster for Game Theory. Volume 69, Number 6,
ASM News
Roztański T. 2003.
http://coin.wne.uw.edu.pl/tkopczewski/MIKROsite/teoria_gier_ksiazka/ch
01.html
Wybrane schematy i rysunki: http://www.britannica.com/topic/gametheory
Dziękuję za uwagę
„Cała ta opowieść o jastrzębiach i gołębiach jest oczywiście
naiwnie prosta. Jest modelem, czymś co w rzeczywistości nie
występuje w przyrodzie, ale ma nam pomóc w zrozumieniu
zjawisk, które naprawdę w naturze istnieją.”
Richard Dawkins
http://markmcmillion.com/hawks-and-doves-part-1/
Download
Random flashcards
123

2 Cards oauth2_google_0a87d737-559d-4799-9194-d76e8d2e5390

Motywacja w zzl

3 Cards ypy

Create flashcards