Teoria Gier i Optymalne Wykorzystanie Wspólnych Zasobów Krzysztof R. Apt CWI, Amsterdam Uniwersytet Amsterdamski Teoria Gier i Optymalne Wykorzystanie Wspólnych Zasobów – p. 1/4 Plan Gra strategiczna. Najlepsza odpowiedź. Równowaga Nasha. Dobro społeczne. Społeczne optimum. Przykłady. Współzawodnictwo Cournota. Teoria Gier i Optymalne Wykorzystanie Wspólnych Zasobów – p. 2/4 Gry strategiczne: Definicja Gra strategiczna dla n > 1 graczy: Każdy gracz ma pewien zbiór strategii. Każdy gracz chce zmaksymalizować swój zysk (lub zminimalizować swoje koszty). Wszyscy gracze wybieraja˛ swoje strategie jednocześnie. Nastepnie ˛ każdy gracz otrzymuje wypłate˛ (lub musi pokryć swoje koszty). Teoria Gier i Optymalne Wykorzystanie Wspólnych Zasobów – p. 3/4 Założenia Każdy gracz działa racjonalnie: jego celem jest zmaksymalizowanie swojej wypłaty (lub zminimalizowanie swoich kosztów). Zasady gry oraz założenie racjonalnego działania sa˛ wspólna˛ wiedza˛ wszystkich graczy. Teoria Gier i Optymalne Wykorzystanie Wspólnych Zasobów – p. 4/4 Przykłady Dylemat Wieźnia ֒ C D C 2, 2 3, 0 D 0, 3 1, 1 M B M 2, 1 0, 0 B 0, 0 1, 2 Walka Płci Orzeł czy Reszka O R O 1, −1 −1, 1 R −1, 1 1, −1 Teoria Gier i Optymalne Wykorzystanie Wspólnych Zasobów – p. 5/4 Równowaga Nasha Weźmy jakaś ˛ gre. ˛ Załóżmy, że każdy gracz wybrał swoja˛ strategie. ˛ Strategia gracza jest najlepsza˛ odpowiedzia˛ na wybór strategii przeciwników jeśli jest przynajmniej tak dobra jak każda inna strategia. Równowaga Nasha: kombinacja strategii graczy, w której każda strategia jest najlepsza˛ odpowiedzia˛ na wybór strategii przeciwników. Intuicja: W równowadze Nasha każdy gracz jest zadowolony ze swojego wyboru. Teoria Gier i Optymalne Wykorzystanie Wspólnych Zasobów – p. 6/4 Równowaga Nasha Załóżmy, że każdy gracz wybrał swoja˛ strategie. ˛ Strategia gracza jest najlepsza˛ odpowiedzia˛ na wybór strategii przeciwników jeśli jest przynajmniej tak dobra jak każda inna strategia. Równowaga Nasha: kombinacja strategii graczy, w której każda strategia jest najlepsza˛ odpowiedzia˛ na wybór strategii przeciwników. Notacja: si , s′i ∈ Si ; s, s′ , (si , s−i ) ∈ S1 × . . . × Sn . si jest najlepsza˛ odpowiedzia˛ na s−i jeśli ∀s′i ∈ Si pi (si , s−i ) ≥ pi (s′i , s−i ). s jest równowaga˛ Nasha jeśli dla każdego i ∀s′i ∈ Si pi (si , s−i ) ≥ pi (s′i , s−i ). Teoria Gier i Optymalne Wykorzystanie Wspólnych Zasobów – p. 7/4 Równowaga Nasha: Przykłady Dylemat Wieźnia ֒ Walka Płci 1 równowaga Nasha C D C 2, 2 0, 3 D 3, 0 1, 1 2 równowagi Nasha M M 2, 1 B 0, 0 Orzeł czy Reszka B 0, 0 1, 2 brak równowagi Nasha O R O 1, −1 −1, 1 R −1, 1 1, −1 Teoria Gier i Optymalne Wykorzystanie Wspólnych Zasobów – p. 8/4 John Nash Z Wikipedii: ”John Forbes Nash Jr (ur. 13 czerwca 1928). Amerykański matematyk i ekonomista. [...] Był współlaureatem nagrody Banku Szwecji im. Alfreda Nobla w dziedzinie ekonomii w 1994 roku. [...] Nash cierpiał na schizofrenie˛ paranoidalna. ˛ [...] Historia jego życia została zekranizowana w 2001 roku w filmie Piekny ˛ umysł (A Beautiful Mind).” Teoria Gier i Optymalne Wykorzystanie Wspólnych Zasobów – p. 9/4 Dodatkowe Pojecia ˛ Dobro społeczne s: Pn j=1 pj (s). s jest społecznym optimum jeśli dobro społeczne s jest maksymalne. Teoria Gier i Optymalne Wykorzystanie Wspólnych Zasobów – p. 10/4 Przykład: Dylemat Wieźnia ˛ C D C 2, 2 3, 0 D 0, 3 1, 1 1 równowaga Nasha: (D, D), 1 społeczne optimum: (C, C). Zauważ: dobro społeczne w równowadze Nasha: 2, dobro społeczne w społecznym optimum: 4. Teoria Gier i Optymalne Wykorzystanie Wspólnych Zasobów – p. 11/4 Dylemat Wieźnia ˛ w Praktyce Teoria Gier i Optymalne Wykorzystanie Wspólnych Zasobów – p. 12/4 Współzawodnictwo Cournota Augustin Cournot (1838) jeden produkt, n > 1 firm decyduje jednocześnie o wysokości produkcji, cena maleje ze wzrostem produkcji globalnej. Teoria Gier i Optymalne Wykorzystanie Wspólnych Zasobów – p. 13/4 Współzawodnictwo Cournota formalnie Modelowanie przy użyciu gier strategicznych. Załóżmy, że dla każdego gracza i jego zbiór strategii jest R+ , jego funkcja wypłaty jest pi (s) := si (a − b n X sj ) − csi , j=1 gdzie a > c i b > 0. Teoria Gier i Optymalne Wykorzystanie Wspólnych Zasobów – p. 14/4 Uwagi Funkcja wypłaty: pi (s) := si (a − b n X sj ) − csi , j=1 gdzie a > c i b > 0. Pn Cena produktu: a − b j=1 sj . Ponieważ b > 0 cena rzeczywiście maleje ze wzrostem produkcji globalnej. Koszt produkcji jednego egzemplarza: c. Gdyby a ≤ c wypłaty byłyby zawsze ujemne. Teoria Gier i Optymalne Wykorzystanie Wspólnych Zasobów – p. 15/4 Analiza: Równowaga Nasha Dla danego i ∈ {1, . . ., n} i s−i niech t := P j6=i sj . pi (si , t) = si (a − c − bt − bsi ) = −bs2i + (a − c − bt)si . Chcemy znaleźć maksimum pi (si ). p′i (si ) = −2bsi + a − c − bt. p′i (si ) = 0 gdy t − si = a−c 2b 2. Czyli s jest P równowaga˛ Nasha gdy dla każdego i si = a−c 2b − j6=i 2 sj . Ten system n liniowych równań ma dokładnie jedno rozwiazanie: ˛ a−c dla i ∈ {1, . . ., n}. si = (n+1)b Wiec ˛ jest to jedyna równowaga Nasha. Teoria Gier i Optymalne Wykorzystanie Wspólnych Zasobów – p. 16/4 Analiza: Społeczne Optimum Pn Niech t := j=1 sj . Pn Wówczas f (t) := j=1 pj (s) = t(a − c − bt). Chcemy znaleźć maksimum f (t). f ′ (t) = 0 gdy a−c t= . 2b Teoria Gier i Optymalne Wykorzystanie Wspólnych Zasobów – p. 17/4 Wnioski Równowaga Nasha: gdy każde si = a+nc n+1 . Pn Społeczne optimum: gdy j=1 sj Wówczas cena produktu: a+c 2 . a+nc Ponieważ a > c wiec ˛ a+c > 2 n+1 . a−c (n+1)b . Wówczas cena produktu: = a−c 2b . Czyli cena w społecznym optimum jest wyższa niż w równowadze Nasha. Gdy n wzrasta cena w równowadze Nasha, a+nc n+1 , spada. Czyli zwiekszone ˛ współzawodnictwo jest pożyteczne dla klientów. limn → ∞ a+nc n+1 = c. Czyli zwiekszone ˛ współzawodnictwo prowadzi do zerowych zysków. Teoria Gier i Optymalne Wykorzystanie Wspólnych Zasobów – p. 18/4 Plan Tragedia wspólnot. Gry sieciowe. Przykłady. Teoria Gier i Optymalne Wykorzystanie Wspólnych Zasobów – p. 19/4 Tragedia Wspólnot Wspólne zasoby: dobra, z których każdy może za darmo korzystać, ale ich użycie przez jakakolwiek ˛ osobe˛ ogranicza dostepność ˛ innym. Przykłady: zatłoczone (darmowe) drogi samochodowe, ryby w morzu, środowisko, . . ., Problem: Nadużycie takich wspólnych zasób prowadzi do ich zniszczenia. Ten problem nazywa sie˛ tragedia˛ wspólnot (Hardin ’81). Teoria Gier i Optymalne Wykorzystanie Wspólnych Zasobów – p. 20/4 Tragedia Wspólnot: Przykład (Gardner ’95) n > 1 graczy, dwie strategie: 1 (użyj zasobu), 0 (nie użyj), funkcja wypłat: ( pi (s) := gdzie m = 0.1 jeśli si = 0 F (m)/m jeśli si = 1 Pn 2. s i F (m) := 1.1m − 0.1m j=1 j Funkcja F jest tak skonstruowana, że F (m)/m maleje i szybko opada poniżej 0: F (9)/9 = 0.2, F (10)/10 = 0.1, F (11)/11 = 0. Teoria Gier i Optymalne Wykorzystanie Wspólnych Zasobów – p. 21/4 Przykład: Równowagi Nasha Załóżmy n < 10. ( pi (s) := 0.1 jeśli si = 0 F (m)/m jeśli si = 1 Pn gdzie m = j=1 sj i F (m) := 1.1m − 0.1m2 . F (9)/9 = 0.2, F (10)/10 = 0.1, F (11)/11 = 0. Ponieważ n < 10 mamy m + 1 < 10, czyli F (m + 1)/(m + 1) > 0.1. A wiec ˛ jeśli si = 1 gracz i jest zadowolony. Jedyna równowaga Nasha: wszyscy gracze korzystaja˛ ze wspólnego zasobu. Gdy n ≥ 10 jedyne równowagi Nasha: 9 lub 10 graczy korzysta ze wspólnego zasobu. Teoria Gier i Optymalne Wykorzystanie Wspólnych Zasobów – p. 22/4 Przykład: Społeczne Optimum pi (s) := gdzie m = ( 0.1 jeśli si = 0 F (m)/m jeśli si = 1 Pn 2. s i F (m) := 1.1m − 0.1m j j=1 Załóżmy m spośród n graczy używa zasobu. Wówczas Pn j=1 pj (s) = 0.1(n − m) + F (m). Ale f (m) = 0.1(n − m) + F (m) = 0.1n + m − 0.1m2 . Czyli f ′ (m) = 1 − 0.2m, wiec ˛ f ′ (m) = 0 gdy m = 5. Społeczne optimum: 5ciu graczy korzysta ze wspólnego zasobu. Teoria Gier i Optymalne Wykorzystanie Wspólnych Zasobów – p. 23/4 Gry Sieciowe: Przykład 5 kierowców. Każdy kierowca wybiera droge˛ z Katowic do Gliwic, Wiecej ˛ kierowców wybiera te˛ sama˛ droge: ˛ wieksze ˛ opóźnienia. Uwaga: to sa˛ gry z kosztami and nie z wypłatami. KATOWICE 1/2/3 1/4/5 1/5/6 GLIWICE Teoria Gier i Optymalne Wykorzystanie Wspólnych Zasobów – p. 24/4 Możliwy Rozwój Wydarzeń (1) KATOWICE 1/2/3 1/4/5 1/5/6 GLIWICE Teoria Gier i Optymalne Wykorzystanie Wspólnych Zasobów – p. 25/4 Możliwy Rozwój Wydarzeń (2) KATOWICE 1/2/3 1/4/5 1/5/6 GLIWICE Teoria Gier i Optymalne Wykorzystanie Wspólnych Zasobów – p. 26/4 Możliwy Rozwój Wydarzeń (3) KATOWICE 1/2/3 1/4/5 1/5/6 GLIWICE Teoria Gier i Optymalne Wykorzystanie Wspólnych Zasobów – p. 27/4 Możliwy Rozwój Wydarzeń (4) KATOWICE 1/2/3 1/4/5 1/5/6 GLIWICE Teraz każdy kierowca jest zadowolony. Teoria Gier i Optymalne Wykorzystanie Wspólnych Zasobów – p. 28/4 Jak znaleźliśmy równowage˛ Nasha? Dynamika najlepszej odpowiedzi (‘Best response dynamics’). Wybierz ‘sytuacje˛ poczatkow ˛ a’: ˛ każdy gracz wybiera dowolna˛ strategie. ˛ ‘Niezadowolony’ gracz może zmienić swój wybór wybierajac ˛ najlepsza˛ odpowiedź. Powtórz te˛ procedure. ˛ Jeśli ta procedura sie˛ kończy to osiagn ˛ eliśmy ˛ równowage˛ Nasha. Twierdzenie (Rosenthal, 1973) W grach sieciowych dynamika najlepszej odpowiedzi zawsze prowadzi do równowagi Nasha. Teoria Gier i Optymalne Wykorzystanie Wspólnych Zasobów – p. 29/4 Inny Przykład Założenia: 4000 kierowców jedzie z A do B. Każdy kierowca ma 2 możliwości (strategie). U T/100 45 45 B T/100 A R Problem: Znajdź równowage˛ Nasha (T = liczba kierowców). Teoria Gier i Optymalne Wykorzystanie Wspólnych Zasobów – p. 30/4 Równowaga Nasha U T/100 45 45 B T/100 A R Odpowiedź: 2000/2000. Czas jazdy: 2000/100 + 45 = 45 + 2000/100 = 65. Teoria Gier i Optymalne Wykorzystanie Wspólnych Zasobów – p. 31/4 Paradoks Braessa Dodaj szybka˛ droge˛ z U do R. Każdy kierowca ma teraz 3 możliwości (strategie): A - U - B, A - R - B, A - U - R - B. U T/100 45 0 A 45 B T/100 R Problem: Znajdź równowage˛ Nasha. Teoria Gier i Optymalne Wykorzystanie Wspólnych Zasobów – p. 32/4 Równowaga Nasha U T/100 45 0 A 45 B T/100 R Odpowiedź: Każdy kierowca wybierze droge˛ A - U - R - B. Dlaczego?: Droga A - U - R - B jest zawsze najlepsza˛ odpowiedzia. ˛ Teoria Gier i Optymalne Wykorzystanie Wspólnych Zasobów – p. 33/4 Mała komplikacja U T/100 45 0 A 45 B T/100 R Czas jazdy: 4000/100 + 4000/100 = 80! Teoria Gier i Optymalne Wykorzystanie Wspólnych Zasobów – p. 34/4 Czy to sie˛ zdarza? z Wikipedii (‘Braess Paradox’): In Seoul, South Korea, a speeding-up in traffic around the city was seen when a motorway was removed as part of the Cheonggyecheon restoration project. In Stuttgart, Germany after investments into the road network in 1969, the traffic situation did not improve until a section of newly-built road was closed for traffic again. In 1990 the closing of 42nd street in New York City reduced the amount of congestion in the area. In 2008 Youn, Gastner and Jeong demonstrated specific routes in Boston, New York City and London where this might actually occur and pointed out roads that could be closed to reduce predicted travel times. Teoria Gier i Optymalne Wykorzystanie Wspólnych Zasobów – p. 35/4 Cena Stabilności Definicja CS: koszty społeczne najlepszej równowagi Nasha społeczne optimum Pytanie: Ile wynosi CS dla gier sieciowych? Teoria Gier i Optymalne Wykorzystanie Wspólnych Zasobów – p. 36/4 Przykład n B A x n - (parzysta) ilość graczy. x - ilość kierowców na dolnej drodze. Dwie równowagi Nasha 1/(n − 1), z kosztem społecznym n + (n − 1)2 . 0/ n, z kosztem społecznym n2 . Społeczne optimum Weźmy f (x) = x · x + (n − x) · n = x2 − n · x + n2 . Chcemy znaleźć minimum f . f ′ (x) = 2x − n, wiec ˛ f ′ (x) = 0 jeśli x = n2 . Teoria Gier i Optymalne Wykorzystanie Wspólnych Zasobów – p. 37/4 Przykład n B A x Najlepsza równowaga Nasha 1/(n − 1), z kosztem społecznym n + (n − 1)2 . Społeczne optimum f (x) = x2 − n · x + n2 . Społeczne optimum = f ( n2 ) = 43 n2 . CS = (n + (n − 1)2 )/ 43 n2 limn→∞ CS = 34 . = 2 4 n+(n−1) 3 n2 . Teoria Gier i Optymalne Wykorzystanie Wspólnych Zasobów – p. 38/4 Cena Stabilności Twierdzenie (Roughgarden i Tárdos, 2002) Załóżmy, że funkcje opóźnień sa˛ liniowe (n.p. T /100). Wówczas CS gier sieciowych jest ≤ 34 . Dobra˛ równowage˛ Nasha można osiagn ˛ ać ˛ przy użyciu dynamiki najlepszej odpowiedzi (best response dynamics). Niestety: czas niezbedny ˛ do osiagni ˛ ecia ˛ równowagi może być bardzo długi – jest wykładnicza˛ funkcja˛ liczby strategii. Teoria Gier i Optymalne Wykorzystanie Wspólnych Zasobów – p. 39/4 Referencje T. Roughgarden and E. Tardos, How bad is selfish routing?, Journal of the ACM, 49(2), pp. 236–259, 2002. Modeling Network Traffic using Game Theory. (Rozdział 8 z D. Easley and J. Kleinberg, Networks, Crowds, and Markets: Reasoning About a Highly Connected World. Cambridge University Press, 2010. ) www.cs.cornell.edu/home/kleinber/networks-book Teoria Gier i Optymalne Wykorzystanie Wspólnych Zasobów – p. 40/4