Teoria Gier i Optymalne Wykorzystanie

advertisement
Teoria Gier i Optymalne
Wykorzystanie Wspólnych Zasobów
Krzysztof R. Apt
CWI, Amsterdam
Uniwersytet Amsterdamski
Teoria Gier i Optymalne Wykorzystanie Wspólnych Zasobów – p. 1/4
Plan
Gra strategiczna.
Najlepsza odpowiedź.
Równowaga Nasha.
Dobro społeczne.
Społeczne optimum.
Przykłady.
Współzawodnictwo Cournota.
Teoria Gier i Optymalne Wykorzystanie Wspólnych Zasobów – p. 2/4
Gry strategiczne: Definicja
Gra strategiczna dla n > 1 graczy:
Każdy gracz ma pewien zbiór strategii.
Każdy gracz chce zmaksymalizować swój zysk
(lub zminimalizować swoje koszty).
Wszyscy gracze wybieraja˛ swoje strategie jednocześnie.
Nastepnie
˛
każdy gracz otrzymuje wypłate˛
(lub musi pokryć swoje koszty).
Teoria Gier i Optymalne Wykorzystanie Wspólnych Zasobów – p. 3/4
Założenia
Każdy gracz działa racjonalnie: jego celem jest
zmaksymalizowanie swojej wypłaty
(lub zminimalizowanie swoich kosztów).
Zasady gry oraz założenie racjonalnego działania sa˛
wspólna˛ wiedza˛ wszystkich graczy.
Teoria Gier i Optymalne Wykorzystanie Wspólnych Zasobów – p. 4/4
Przykłady
Dylemat Wieźnia
֒
C
D
C
2, 2
3, 0
D
0, 3
1, 1
M
B
M
2, 1
0, 0
B
0, 0
1, 2
Walka Płci
Orzeł czy Reszka
O
R
O
1, −1
−1, 1
R
−1, 1
1, −1
Teoria Gier i Optymalne Wykorzystanie Wspólnych Zasobów – p. 5/4
Równowaga Nasha
Weźmy jakaś
˛ gre.
˛
Załóżmy, że każdy gracz wybrał swoja˛ strategie.
˛
Strategia gracza jest najlepsza˛ odpowiedzia˛ na wybór
strategii przeciwników jeśli jest przynajmniej tak dobra jak
każda inna strategia.
Równowaga Nasha: kombinacja strategii graczy, w której
każda strategia jest najlepsza˛ odpowiedzia˛ na wybór strategii
przeciwników.
Intuicja: W równowadze Nasha każdy gracz jest zadowolony
ze swojego wyboru.
Teoria Gier i Optymalne Wykorzystanie Wspólnych Zasobów – p. 6/4
Równowaga Nasha
Załóżmy, że każdy gracz wybrał swoja˛ strategie.
˛
Strategia gracza jest najlepsza˛ odpowiedzia˛ na wybór
strategii przeciwników jeśli jest przynajmniej tak dobra jak
każda inna strategia.
Równowaga Nasha: kombinacja strategii graczy, w której
każda strategia jest najlepsza˛ odpowiedzia˛ na wybór strategii
przeciwników.
Notacja: si , s′i ∈ Si ; s, s′ , (si , s−i ) ∈ S1 × . . . × Sn .
si jest najlepsza˛ odpowiedzia˛ na s−i jeśli
∀s′i ∈ Si pi (si , s−i ) ≥ pi (s′i , s−i ).
s jest równowaga˛ Nasha jeśli dla każdego i
∀s′i ∈ Si pi (si , s−i ) ≥ pi (s′i , s−i ).
Teoria Gier i Optymalne Wykorzystanie Wspólnych Zasobów – p. 7/4
Równowaga Nasha: Przykłady
Dylemat Wieźnia
֒
Walka Płci
1 równowaga Nasha
C
D
C 2, 2 0, 3
D 3, 0 1, 1
2 równowagi Nasha
M
M 2, 1
B 0, 0
Orzeł czy Reszka
B
0, 0
1, 2
brak równowagi Nasha
O
R
O
1, −1 −1, 1
R −1, 1
1, −1
Teoria Gier i Optymalne Wykorzystanie Wspólnych Zasobów – p. 8/4
John Nash
Z Wikipedii:
”John Forbes Nash Jr (ur. 13 czerwca 1928). Amerykański
matematyk i ekonomista. [...] Był współlaureatem nagrody
Banku Szwecji im. Alfreda Nobla w dziedzinie ekonomii w 1994
roku. [...] Nash cierpiał na schizofrenie˛ paranoidalna.
˛ [...]
Historia jego życia została zekranizowana w 2001 roku w filmie
Piekny
˛
umysł (A Beautiful Mind).”
Teoria Gier i Optymalne Wykorzystanie Wspólnych Zasobów – p. 9/4
Dodatkowe Pojecia
˛
Dobro społeczne s:
Pn
j=1 pj (s).
s jest społecznym optimum jeśli dobro społeczne s jest
maksymalne.
Teoria Gier i Optymalne Wykorzystanie Wspólnych Zasobów – p. 10/4
Przykład: Dylemat Wieźnia
˛
C
D
C
2, 2
3, 0
D
0, 3
1, 1
1 równowaga Nasha: (D, D),
1 społeczne optimum: (C, C).
Zauważ:
dobro społeczne w równowadze Nasha: 2,
dobro społeczne w społecznym optimum: 4.
Teoria Gier i Optymalne Wykorzystanie Wspólnych Zasobów – p. 11/4
Dylemat Wieźnia
˛
w Praktyce
Teoria Gier i Optymalne Wykorzystanie Wspólnych Zasobów – p. 12/4
Współzawodnictwo Cournota
Augustin Cournot (1838)
jeden produkt,
n > 1 firm decyduje jednocześnie o wysokości produkcji,
cena maleje ze wzrostem produkcji globalnej.
Teoria Gier i Optymalne Wykorzystanie Wspólnych Zasobów – p. 13/4
Współzawodnictwo Cournota formalnie
Modelowanie przy użyciu gier strategicznych.
Załóżmy, że dla każdego gracza i
jego zbiór strategii jest R+ ,
jego funkcja wypłaty jest
pi (s) := si (a − b
n
X
sj ) − csi ,
j=1
gdzie a > c i b > 0.
Teoria Gier i Optymalne Wykorzystanie Wspólnych Zasobów – p. 14/4
Uwagi
Funkcja wypłaty:
pi (s) := si (a − b
n
X
sj ) − csi ,
j=1
gdzie a > c i b > 0.
Pn
Cena produktu: a − b j=1 sj .
Ponieważ b > 0 cena rzeczywiście maleje ze wzrostem
produkcji globalnej.
Koszt produkcji jednego egzemplarza: c.
Gdyby a ≤ c wypłaty byłyby zawsze ujemne.
Teoria Gier i Optymalne Wykorzystanie Wspólnych Zasobów – p. 15/4
Analiza: Równowaga Nasha
Dla danego i ∈ {1, . . ., n} i s−i niech t :=
P
j6=i sj .
pi (si , t) = si (a − c − bt − bsi ) = −bs2i + (a − c − bt)si .
Chcemy znaleźć maksimum pi (si ).
p′i (si ) = −2bsi + a − c − bt.
p′i (si ) = 0 gdy
t
−
si = a−c
2b
2.
Czyli s jest P
równowaga˛ Nasha gdy dla każdego i
si =
a−c
2b
−
j6=i
2
sj
.
Ten system n liniowych równań ma dokładnie jedno
rozwiazanie:
˛
a−c
dla i ∈ {1, . . ., n}.
si = (n+1)b
Wiec
˛ jest to jedyna równowaga Nasha.
Teoria Gier i Optymalne Wykorzystanie Wspólnych Zasobów – p. 16/4
Analiza: Społeczne Optimum
Pn
Niech t := j=1 sj .
Pn
Wówczas f (t) := j=1 pj (s) = t(a − c − bt).
Chcemy znaleźć maksimum f (t).
f ′ (t) = 0 gdy
a−c
t=
.
2b
Teoria Gier i Optymalne Wykorzystanie Wspólnych Zasobów – p. 17/4
Wnioski
Równowaga Nasha: gdy każde si =
a+nc
n+1 .
Pn
Społeczne optimum: gdy j=1 sj
Wówczas cena produktu: a+c
2 .
a+nc
Ponieważ a > c wiec
˛ a+c
>
2
n+1 .
a−c
(n+1)b .
Wówczas cena produktu:
=
a−c
2b .
Czyli cena w społecznym optimum jest wyższa niż w
równowadze Nasha.
Gdy n wzrasta cena w równowadze Nasha, a+nc
n+1 , spada.
Czyli zwiekszone
˛
współzawodnictwo jest pożyteczne dla
klientów.
limn → ∞ a+nc
n+1 = c.
Czyli zwiekszone
˛
współzawodnictwo prowadzi do zerowych
zysków.
Teoria Gier i Optymalne Wykorzystanie Wspólnych Zasobów – p. 18/4
Plan
Tragedia wspólnot.
Gry sieciowe.
Przykłady.
Teoria Gier i Optymalne Wykorzystanie Wspólnych Zasobów – p. 19/4
Tragedia Wspólnot
Wspólne zasoby: dobra, z których każdy może za darmo
korzystać, ale ich użycie przez jakakolwiek
˛
osobe˛ ogranicza
dostepność
˛
innym.
Przykłady: zatłoczone (darmowe) drogi samochodowe, ryby
w morzu, środowisko, . . .,
Problem: Nadużycie takich wspólnych zasób prowadzi do ich
zniszczenia.
Ten problem nazywa sie˛ tragedia˛ wspólnot (Hardin ’81).
Teoria Gier i Optymalne Wykorzystanie Wspólnych Zasobów – p. 20/4
Tragedia Wspólnot: Przykład
(Gardner ’95)
n > 1 graczy,
dwie strategie:
1 (użyj zasobu),
0 (nie użyj),
funkcja wypłat:
(
pi (s) :=
gdzie m =
0.1
jeśli si = 0
F (m)/m jeśli si = 1
Pn
2.
s
i
F
(m)
:=
1.1m
−
0.1m
j=1 j
Funkcja F jest tak skonstruowana, że F (m)/m maleje i
szybko opada poniżej 0:
F (9)/9 = 0.2, F (10)/10 = 0.1, F (11)/11 = 0.
Teoria Gier i Optymalne Wykorzystanie Wspólnych Zasobów – p. 21/4
Przykład: Równowagi Nasha
Załóżmy n < 10.
(
pi (s) :=
0.1
jeśli si = 0
F (m)/m jeśli si = 1
Pn
gdzie m = j=1 sj i F (m) := 1.1m − 0.1m2 .
F (9)/9 = 0.2, F (10)/10 = 0.1, F (11)/11 = 0.
Ponieważ n < 10 mamy m + 1 < 10, czyli
F (m + 1)/(m + 1) > 0.1.
A wiec
˛ jeśli si = 1 gracz i jest zadowolony.
Jedyna równowaga Nasha:
wszyscy gracze korzystaja˛ ze wspólnego zasobu.
Gdy n ≥ 10 jedyne równowagi Nasha:
9 lub 10 graczy korzysta ze wspólnego zasobu.
Teoria Gier i Optymalne Wykorzystanie Wspólnych Zasobów – p. 22/4
Przykład: Społeczne Optimum
pi (s) :=
gdzie m =
(
0.1
jeśli si = 0
F (m)/m jeśli si = 1
Pn
2.
s
i
F
(m)
:=
1.1m
−
0.1m
j
j=1
Załóżmy m spośród n graczy używa zasobu.
Wówczas
Pn
j=1 pj (s) = 0.1(n − m) + F (m).
Ale
f (m) = 0.1(n − m) + F (m) = 0.1n + m − 0.1m2 .
Czyli
f ′ (m) = 1 − 0.2m, wiec
˛ f ′ (m) = 0 gdy m = 5.
Społeczne optimum: 5ciu graczy korzysta ze wspólnego
zasobu.
Teoria Gier i Optymalne Wykorzystanie Wspólnych Zasobów – p. 23/4
Gry Sieciowe: Przykład
5 kierowców.
Każdy kierowca wybiera droge˛ z Katowic do Gliwic,
Wiecej
˛
kierowców wybiera te˛ sama˛ droge:
˛ wieksze
˛
opóźnienia.
Uwaga: to sa˛ gry z kosztami and nie z wypłatami.
KATOWICE
1/2/3
1/4/5
1/5/6
GLIWICE
Teoria Gier i Optymalne Wykorzystanie Wspólnych Zasobów – p. 24/4
Możliwy Rozwój Wydarzeń (1)
KATOWICE
1/2/3
1/4/5
1/5/6
GLIWICE
Teoria Gier i Optymalne Wykorzystanie Wspólnych Zasobów – p. 25/4
Możliwy Rozwój Wydarzeń (2)
KATOWICE
1/2/3
1/4/5
1/5/6
GLIWICE
Teoria Gier i Optymalne Wykorzystanie Wspólnych Zasobów – p. 26/4
Możliwy Rozwój Wydarzeń (3)
KATOWICE
1/2/3
1/4/5
1/5/6
GLIWICE
Teoria Gier i Optymalne Wykorzystanie Wspólnych Zasobów – p. 27/4
Możliwy Rozwój Wydarzeń (4)
KATOWICE
1/2/3
1/4/5
1/5/6
GLIWICE
Teraz każdy kierowca jest zadowolony.
Teoria Gier i Optymalne Wykorzystanie Wspólnych Zasobów – p. 28/4
Jak znaleźliśmy równowage˛ Nasha?
Dynamika najlepszej odpowiedzi (‘Best response dynamics’).
Wybierz ‘sytuacje˛ poczatkow
˛
a’:
˛ każdy gracz wybiera
dowolna˛ strategie.
˛
‘Niezadowolony’ gracz może zmienić swój wybór wybierajac
˛
najlepsza˛ odpowiedź.
Powtórz te˛ procedure.
˛
Jeśli ta procedura sie˛ kończy to osiagn
˛ eliśmy
˛
równowage˛ Nasha.
Twierdzenie (Rosenthal, 1973) W grach sieciowych dynamika
najlepszej odpowiedzi zawsze prowadzi do równowagi Nasha.
Teoria Gier i Optymalne Wykorzystanie Wspólnych Zasobów – p. 29/4
Inny Przykład
Założenia:
4000 kierowców jedzie z A do B.
Każdy kierowca ma 2 możliwości (strategie).
U
T/100
45
45
B
T/100
A
R
Problem: Znajdź równowage˛ Nasha (T = liczba kierowców).
Teoria Gier i Optymalne Wykorzystanie Wspólnych Zasobów – p. 30/4
Równowaga Nasha
U
T/100
45
45
B
T/100
A
R
Odpowiedź: 2000/2000.
Czas jazdy: 2000/100 + 45 = 45 + 2000/100 = 65.
Teoria Gier i Optymalne Wykorzystanie Wspólnych Zasobów – p. 31/4
Paradoks Braessa
Dodaj szybka˛ droge˛ z U do R.
Każdy kierowca ma teraz 3 możliwości (strategie):
A - U - B,
A - R - B,
A - U - R - B.
U
T/100
45
0
A
45
B
T/100
R
Problem: Znajdź równowage˛ Nasha.
Teoria Gier i Optymalne Wykorzystanie Wspólnych Zasobów – p. 32/4
Równowaga Nasha
U
T/100
45
0
A
45
B
T/100
R
Odpowiedź: Każdy kierowca wybierze droge˛ A - U - R - B.
Dlaczego?: Droga A - U - R - B jest zawsze najlepsza˛
odpowiedzia.
˛
Teoria Gier i Optymalne Wykorzystanie Wspólnych Zasobów – p. 33/4
Mała komplikacja
U
T/100
45
0
A
45
B
T/100
R
Czas jazdy: 4000/100 + 4000/100 = 80!
Teoria Gier i Optymalne Wykorzystanie Wspólnych Zasobów – p. 34/4
Czy to sie˛ zdarza?
z Wikipedii (‘Braess Paradox’):
In Seoul, South Korea, a speeding-up in traffic around the
city was seen when a motorway was removed as part of the
Cheonggyecheon restoration project.
In Stuttgart, Germany after investments into the road
network in 1969, the traffic situation did not improve until a
section of newly-built road was closed for traffic again.
In 1990 the closing of 42nd street in New York City reduced
the amount of congestion in the area.
In 2008 Youn, Gastner and Jeong demonstrated specific
routes in Boston, New York City and London where this
might actually occur and pointed out roads that could be
closed to reduce predicted travel times.
Teoria Gier i Optymalne Wykorzystanie Wspólnych Zasobów – p. 35/4
Cena Stabilności
Definicja
CS:
koszty społeczne najlepszej równowagi Nasha
społeczne optimum
Pytanie: Ile wynosi CS dla gier sieciowych?
Teoria Gier i Optymalne Wykorzystanie Wspólnych Zasobów – p. 36/4
Przykład
n
B
A
x
n - (parzysta) ilość graczy.
x - ilość kierowców na dolnej drodze.
Dwie równowagi Nasha
1/(n − 1), z kosztem społecznym n + (n − 1)2 .
0/ n, z kosztem społecznym n2 .
Społeczne optimum
Weźmy f (x) = x · x + (n − x) · n = x2 − n · x + n2 .
Chcemy znaleźć minimum f .
f ′ (x) = 2x − n, wiec
˛ f ′ (x) = 0 jeśli x = n2 .
Teoria Gier i Optymalne Wykorzystanie Wspólnych Zasobów – p. 37/4
Przykład
n
B
A
x
Najlepsza równowaga Nasha
1/(n − 1), z kosztem społecznym n + (n − 1)2 .
Społeczne optimum
f (x) = x2 − n · x + n2 .
Społeczne optimum = f ( n2 ) = 43 n2 .
CS = (n + (n − 1)2 )/ 43 n2
limn→∞ CS = 34 .
=
2
4 n+(n−1)
3
n2
.
Teoria Gier i Optymalne Wykorzystanie Wspólnych Zasobów – p. 38/4
Cena Stabilności
Twierdzenie (Roughgarden i Tárdos, 2002)
Załóżmy, że funkcje opóźnień sa˛ liniowe (n.p. T /100).
Wówczas CS gier sieciowych jest ≤ 34 .
Dobra˛ równowage˛ Nasha można osiagn
˛ ać
˛ przy użyciu
dynamiki najlepszej odpowiedzi (best response dynamics).
Niestety: czas niezbedny
˛
do osiagni
˛ ecia
˛
równowagi może
być bardzo długi – jest wykładnicza˛ funkcja˛ liczby strategii.
Teoria Gier i Optymalne Wykorzystanie Wspólnych Zasobów – p. 39/4
Referencje
T. Roughgarden and E. Tardos, How bad is selfish routing?,
Journal of the ACM, 49(2), pp. 236–259, 2002.
Modeling Network Traffic using Game Theory.
(Rozdział 8 z D. Easley and J. Kleinberg,
Networks, Crowds, and Markets:
Reasoning About a Highly Connected World.
Cambridge University Press, 2010. )
www.cs.cornell.edu/home/kleinber/networks-book
Teoria Gier i Optymalne Wykorzystanie Wspólnych Zasobów – p. 40/4
Download