Teorie gier w socjobiologii (BPZ – ćwiczenia) Magdalena Reuter Teorie gier • Dział matematyki zajmujący się badaniem zachowania graczy w przypadku konfliktu interesów. • Teoria gier wywodzi się z badania gier hazardowych, (stąd terminologia). • Zastosowania: w ekonomii, biologii, socjobiologii, socjologii, informatyce. Teorie gier a teorie decyzji • Teoria gier jak i teoria decyzji analizują sposoby podejmowania optymalnych decyzji w rozmaitych sytuacjach. Różnice: • W teorii gier działania podejmowane przez każdego z uczestników mają wpływ na pozostałych uczestników gry, i gdy gracze podejmują decyzję co do wyboru swoich strategii biorą te interakcje pod uwagę. • W teorii decyzji, decyzje mogą być podejmowane w warunkach ryzyka lub niepewności, ale nie zależą one od strategicznych działań osób innych niż osoba, która decyduje. Teorie gier • Gra – każda sytuacja konfliktowa pomiędzy co najmniej dwoma graczami • Gracze – dowolni uczestnicy (ludzie, zwierzęta, przedsiębiorstwa) • Strategia postępowania – wybierana przez każdego z graczy z uwzględnieniem posunięć przeciwnika • Wypłata – otrzymywana w wyniku starcia z przeciwnikiem (może być w różnych jednostkach użyteczności – pieniądze, wzrost szansy na przekazanie własnych genów, satysfakcja etc.) Gry: • gry o sumie stałej (zysk jednego gracza jest równoważny stracie drugiego) i na gry o sumie zmiennej • gry sprawiedliwe (gdy wartość oczekiwana wypłaty każdego z graczy jest taka sama) oraz gry niesprawiedliwe • dwuosobowe i wieloosobowe Macierz wypłat gracza A w starciu z graczem B B B1 B2 A1 a11 a12 A2 a21 a22 A A, B – gracze A1, A2 – strategie stosowane przez gracza A a11;a12, a 21, a 22 – wygrane gracza A B1, B2 - strategie stosowane przez gracza B w starciu z przeciwnikiem B John Maynard Smith • Brytyjski biolog ewolucyjny oraz genetyk • Zaaplikował teorie gier na grunt ewolucji – stworzył tzw. ewolucyjne teorie gier • Wcześniej George R. Price: Logika konfliktów między zwierzętami Strategia „gołębia” i „jastrzębia” • Wyjaśnia kwestię zachowań rytualnych w czasie konfliktów zwierząt • Strategia „gołębia” – ustępuje każdemu, kto stawi mu opór • Strategia „jastrzębia” – nigdy nie oddaje pola Macierz wypłat w grze „jastrzębia” z „gołębiem” Jastrząb Gołąb Jastrząb (V-C)/2 V Gołąb 0 V/2 V – korzyść C - strata Przypadek 1. Populacja złożona z tylko z „gołębi” • Zysk każdego osobnika w populacji – V/2 • Jeśli pojawi się przypadkiem „jastrząb” uzyska większą korzyć niż każdy z gołębi (V) • Wygrana osobnika w konflikcie zwiększa jego dostosowanie (tj. przeżywalność i liczbę potomstwa); oznacza to przyrost jastrzębi w kolejnych pokoleniach Przypadek 2. Populacja złożona z tylko z „jastrzębi” • Zysk każdego osobnika w populacji: (V – C)/2 • Pierwszy gołąb w populacji „jastrzębi”: 0 • Zysk „gołębia” (0) jest większy od zysku „jastrzębi”, gdy są one wojownicze – wówczas koszty C są duże a zatem, każdy „jastrząb” uzyska: (V – C)/ 2 < 0 • W tej sytuacji liczba gołębi w kolejnych pokoleniach będzie wzrastać Problem jednej strategii • Populacja, w której osobnicy używają wyłącznie jednej strategii, będzie nieodporna na inwazję osobnika, używającego odmiennej strategii (nawet jeśli pozornie, strategia ta wydaje się być słabsza) • Łagodne, ustępujące wszystkim osobniki radzą sobie dobrze w populacjach złożonych z samych agresywnych osobników • Strategia czysta – albo „gołębia” albo „jastrzębia” Strategie ewolucyjnie stabilne • Strategia mieszana – raz „gołębia” raz „jastrzębia” • Price i Smith: równowagowy skład populacji - proporcja „gołębi” i „jastrzębi” do której będzie zmierzać każda populacja Strategie ewolucyjnie stabilne • ESS – evolutionary stable strategy • Są to strategie odporne na inwazje mutantów z uwagi na to, iż osobnicy danej populacji stosują strategie mieszane – raz „gołębia” raz „jastrzębia” z pewnym rozkładem prawdopodobieństwa zależnym od specyfiki gatunku i środowiska • Gry ewolucyjne rozgrywane wielokrotnie, przez wiele pokoleń; wygrana wpływa na liczbę zwolenników danej strategii prowadzących rozgrywki w przyszłości • Gry ewolucyjne to nie jednorazowa partia w szachy... Rozgrywane obecnie strategie mają wpływ na starcia w kolejnych konfliktach Strategie mieszane: rodzaje gier • Gry symetryczne – obaj gracze są w tej samej sytuacji, ale w trakcie sporu mogą stosować różne strategie • Gry niesymetryczne - obaj gracze są w różnej sytuacji, a w trakcie gry też mogą stosować różne strategie Gry niesymetryczne • Konflikty między osobnikiem dużym i małym, starym i młodym, samcem i samicą • Spór między posiadaczem jakiś zasobów oraz osobnikiem, który tych zasobów nie posiada (konflikt m-y „gołębiem”, „jastrzębiem”i”legalistą”) „Legalista” – zachowuje się w zależności od stanu posiadania: gdy ma co bronić przyjmuje strategię „jastrzębia” gdy nie ma czego bronić przyjmuje strategię „gołębia” Matryca wypłat dla gry m-y „G”, „J” i „L” „Jastrząb” „Gołąb” „Legalista” „Jastrząb” (V-C)/2 V [(V-C)/4]+(V/2) „Gołąb” 0 V/2 V/4 „Legalista” (V-C)/4 V/2+V/4 V/2 Starcie „Legalista” – „Legalista” • 50 % szans na to, że osobnik przybędzie pierwszy na miejsce konfliktu, posiądzie zasoby • Zatem jego wypłata: V/2 Starcie „Legalista” – „Jastrząb” • 50 % szans, że”L” przejmie zasoby przed „jastrzębiem” i zachowa się jak „jastrząb” – wtedy będą walczyć o zasoby zatem wypłata legalisty wynosi (V-C)/4 • 50% szans iż „J” wyprzedzi „L” i zmusi do zachowania się jak „G”. Wypłata „J” w tym starciu zatem wynosi: [(V-C)/4] + (V/2) SKŁADNIKI SUMY: (V-C)/4 wypłata „J” w konflikcie z legalistą „jastrzębiem”; V/2 wypłata „J” w konflikcie z legalistą „gołębiem” Starcie „Legalista” – „Gołąb” • 50% szans, iż „L” posiądzie wcześniej zasoby i zachowa się jak „J” (zysk: V/2) oraz 50% szans, że „G” wyprzedzi „L”, wówczas „L” zachowa się jak „G” (zysk: V/4). Zatem ZYSK LEGALISTY: V/2 +V/4 • Zysk „Gołębia” – V/4 (tyle ile uda mu się wyciągnąć od „L” gdy zachowa się jak „G”) Matematyka wzajemnej pomocy Spór o dobór grupowy i indywidualny • Zwolennicy doboru grupowego – zachowania altruistyczne dowodzą, iż dobór grupowy sprzyja ewolucji takich cech, które są dobre dla grupy • Zwolennicy doboru indywidualnego – Dobór indywidualny preferuje cechy, które pomagają realizować interesy osobnicze – altruizm jest wynikiem doboru indywidualnego Dobór indywidualny • Teorie gier wyjaśniają dlaczego zwolennicy doboru indywidualnego wygrywają w sporze • Np. Współistnienie w populacji „jastrzębi” i „gołębi” wyjaśnia, iż „gołąb” realizuje swoje interesy egoistyczne podobnie jak „jastrząb” • Nie jest tak, że „gołąb” ustępując, nie szkodzi innym osobnikom i działa na korzyść populacji czy gatunku... Dwa rodzaje altruizmu • Altruizm odwzajemniony (Trivers) • Altruizm krewniaczy (Hamilton) Robert Trivers • Altruizm odwzajemniony – polega na dokonywaniu aktów altruizmu w sytuacjach, w których prawdopodobieństwo odwzajemnienia pomocy i prawdopodobieństwo potrzeby pomocy w przyszłości jest jak największe. • „Jeśli ja pomogę mu teraz, to gdy ja będę potrzebować pomocy, on odwzajemni się pomagając mi." Altruizm odwzajemniony Sytuacje, w których szanse na altruizm zmniejszają się: 1. Do altruizmu nie będą skłonne jednostki, które radzą sobie dobrze same i nie spodziewają się sytuacji, w której będą potrzebować pomocy. 2. Nie opłaca się pomagać jednostce egoistycznej, po której nie można spodziewać się odwzajemnienia. Przykład altruizmu odwzajemnionego: nietoperze wampiry Matryca wypłat dwóch graczy w grze w Dylemat Więźnia Współpraca Gracz 2 Zdrada Gracz 2 3 pkt Współpraca Gracz 1 Zdrada Gracz 1 3 pkt Gracz 2 5 pkt Gracz 1 0 pkt Gracz 2 0 pkt Gracz 1 5 pkt Gracz 2 1 pkt Gracz 1 1 pkt Teorie gier – dylemat więźnia Dwaj przestępcy złapani przez policję za przewinienie mogą współpracować lub się zdradzić Jeśli: 1.będą współpracować ze sobą (obaj nie będą zeznawać), odsiedzą niewielką karę za małe przewinienie 2.jeden zerwie współpracę i będzie zeznawał, a drugi nie pierwszy zostanie uwolniony, drugi natomiast pójdzie siedzieć za poważne przestępstwo, 3.obaj będą zeznawać, obaj pójdą siedzieć, przy czym wyrok będzie z tego względu nieco złagodzony. X: „Jeśli zdradzę Y-ka... X „Jeśli będę współpracował... a Y mnie nie zdradzi... to uniknę kary a Y odsiedzi 10 lat a Y również mnie zdradzi... to odsiedzimy wspólnie 5 lat a Y też będzie współpracował, to odsiedzimy wspólnie 2 lata a Y mnie zdradzi to odsiedzę sam 10 lat a Y uniknie kary Dylemat więźnia • Istnieje ryzyko, że jeśli będę współpracować to drugi więzień mnie zdradzi, wtedy będę siedzieć za poważne przestępstwo • Opłaca się zatem zdradzić współtowarzysza • Zyski z obustronnej współpracy są wyższe niż kara za obopólną zdradę – jednostronna zdrada stwarza jednak pokusę wyższej wygranej Eksperyment myślowy • Populacja złożona z graczy o niezmiennym algorytmie działania (albo współpraca albo zdrada) • Każdy z każdym gra w Dylemat Więźnia • Wypłata gracza – funkcja graczy z którymi się zmierzył (skład populacji) Eksperyment myślowy • Zdrajca – lepszy wynik od współpracującego • Wypłata to liczba potomstwa • Strategie są dziedziczone • Zatem: liczba zdrajców wzrośnie w populacji, aż ją zdominuje Strategie w przypadku gry wielokrotnej • Jaką osobnik powinien obrać strategię w przypadku gry wielokrotnej? • Jeśli spotykamy kogoś wielokrotnie, istnieje szansa, że jego pomoc nam się w przyszłości przyda. W takiej sytuacji są mniejsze szanse na zdradę. • Strategia w sytuacji gry wielokrotnej zależy od wyniku poprzednich spotkań Strategie w przypadku gry wielokrotnej • Żadna strategia nie jest najlepsza we wszystkich warunkach. • Gdy kontrpartner zawsze współpracuje najlepszą strategią jest zdrada. • Gdy kontrpartner współpracuje tylko wtedy gdy nie zostanie nigdy zdradzony, to dobrą strategią jest współpraca. Nieprzewidywalność gry • Nieprzewidywalność gry w Dylemat Więźnia wynika ze zmieniających się warunków oraz z tego, że nie znamy przyszłych strategii kontrpartnera Robert Axelrod • Seria gier w Dylemat Więźnia z wielokrotnym powtarzaniem przeprowadzona na komputerze • Wygrała strategia „wet za wet” zaproponowana przez Anatola Rapoporta, specjalisty od teorii gier • „wet za wet” - współpraca za pierwszym zagraniem, następnie powtarzanie ruchów przeciwnika Martin A. Nowak, Robert M. May, Karl Sigmund • Symulacje komputerowe z rozbudowanymi strategiami – decyzje podejmowane na podstawie wyniku z poprzedniej rundy • 4 możliwości: pokusa, nagroda, kara, strata • 16 typów graczy Strategie: • Zawsze współpracuj • Zawsze zdradzaj • Wet za wet – przy pierwszym ruchu współpraca a potem powtarzanie ruchów przeciwnika • Strategia Pawłowa („jak dobrze to nie zmieniaj, jak źle zmień”) – powtarzanie ruchu poprzedniego jeśli był zyskowny (korzyść ze współpracy bądź też ze zdrady kogoś współpracującego dotychczas) oraz zmianę jeśli przyniósł straty (współpraca ze zdradzającym lub obopólna zdrada) Martin A. Nowak, Robert M. May, Karl Sigmund • Wynikiem eksperymentu była ilustracja koncepcji naruszonej punktowo równowagi („punctuated equilibria”) z teorii ewolucji • Przez większość czasu prawie wszyscy w populacji albo współpracują albo zdradzają (stan równowagi) • Zmiana zachowań następuje rzadko ale jeśli następuje to w ciągu kilku generacji (stosunkowo szybko) • Wyraźne dążenie do współpracy WNIOSKI • Modele matematyczne zaczerpnięte z teorii gier pokazują sposób powstawania i rozprzestrzeniania się współpracy w układach biologicznych oraz pomagają zrozumieć strategie zachowań społecznych • Współpraca i walka o byt są równie ważne w ewolucji Altruizm krewaniaczy (Hamilton) William Hamilton • Dobór krewniaczy (kin selection) – mechanizm ewolucji biologicznej, prowadzący do adaptacji organizmów, która polega na zwiększaniu szansy przeżycia osobników z nimi spokrewnionych. • Dostosowanie łączne (inclusive fitness) - dostosowanie danego organizmu jest sumą sukcesu reprodukcyjnego oraz wpływu tego organizmu na sukces reprodukcyjny jego krewniaków. Matematyka doboru krewniaczego • Współczynnik pokrewieństwa - liczba od 0 do 1, która mówi jaką część genów dwa osobniki odziedziczyły po wspólnych przodkach (lub jeden względem drugiego) • • • • bliźnięta jednojajowe – 1 rodzic – dziecko 0,5 pełne rodzeństwo 0,5 niepełne rodzeństwo (wspólny 1 rodzic) – 0,25 Matematyka doboru krewniaczego • Jeśli nosiciel danego allelu pomaga swoim krewnym, to częstość tego allelu w populacji może wzrosnąć. • Korzyści odniesione przez krewniaków muszą być zgodne są z zasadą Hamiltona: R×B>C gdzie: R - współczynnik pokrewieństwa; B - zysk reprodukcyjny krewniaka; C - koszt reprodukcyjny osobnika poświęcającego się Przykład pszczół: system rozmnażania haplo-diploidalny Królowe (diploidalne - dwa zespoły chromosomów) Trutnie – (haploidalne - jeden zespół chromosomów) – powstają z jaj niezapłodnionych Robotnice – (diploidalne) powstają w efekcie zapłodnienia komórki jajowej pochodzącej od królowej, przez plemnik pochodzący od jednego z trutni • Komórki jajowe zawierają jeden zespół chromosomów, który jest losową kombinacją obu zestawów genów królowej. • Wszystkie plemniki zawarte w nasieniu jednego trutnia zawierają cały jego zespół chromosomów i są identyczne Altruizm krewaniaczy: przykład pszczół • Współczynnik pokrewieństwa matka-królowa i jej dzieci wynosi 0,5 (połowa chromosomów matki) • Współczynnik pokrewieństwa robotnica – robotnica-siostra od tego samego ojca-trutnia wynosi 0,75 (cały zespół chromosomów po haploidalnym ojcu oraz połowa chromosomów po diploidalnej matce) • Współczynnik pokrewieństwa robotnica – truteńbrat wynosi 0,25 (połowa chromosomów matki) Altruizm krewaniaczy: przykład pszczół • Gen nakazujący robotnicy oddanie życia za dwie inne robotnice mające tego samego ojca (pokrewieństwo 0,75) rozprzestrzeni się w populacji pszczół. (Dwie siostry reprezentują 150% genotypu robotnicy) • Koszt reprodukcyjny poświęcającej się robotnicy wynosi 1 (zero szans na potomstwo). Zatem: 0,75 x 2 > 1 • Altruizm robotnic jest więc w rzeczywistości egoizmem – opłaca się pielęgnować siostry, gdyż można się przyczynić do ekspansji własnego genotypu • Altruizm krewniaczy – efekt rachunku, z którego wynika, że do ekspansji własnego genotypu można się przyczynić lepiej pomagając odpowiedniej liczbie bliskich krewnych, niż przez samodzielne rozmnożenie