D. Ciołek BADANIA OPERACYJNE – wykład 4 BADANIA OPERACYJNE Wykład 4: Podstawy teorii gier. dr Dorota Ciołek Katedra Ekonometrii Wydział Zarządzania UG http://wzr.pl/dc D. Ciołek BADANIA OPERACYJNE – wykład 4 Podstawowe pojęcia Z „grą” mamy do czynienia wtedy, gdy musimy podjąć pewną decyzję nie znając wszystkich czynników, przy czym wynik zależy nie tylko od naszej decyzji, ale od decyzji innych osób lub też od zachowania się czynników niekontrolowanych. Sytuacja do której można zastosować teorię gier strategicznych: skończona liczba uczestników, zarówno zainteresowanych jak i niezainteresowanych, każdy uczestnik dysponuje skończoną liczbą sposobów działania, każdy z uczestników zna wszystkie możliwe sposoby działania innych uczestników, nie wie jednak, które z nich zostaną wybrane, każdej kombinacji sposobów działania wszystkich uczestników odpowiada określona korzyść, korzyść (wygrana) uczestnika zależy zarówno od jego działania jak i od działań wszystkich pozostałych, wszystkie możliwe wyniki podjętych decyzji dają się wyliczyć. Sytuację spełniającą powyższe warunki można nazwać grą. D. Ciołek BADANIA OPERACYJNE – wykład 4 Podstawowe pojęcia Graczem nazywamy każdą zainteresowaną stronę. Gry o sumie zero to takie gry, w których algebraiczna suma wygranych vi jest równa zeru: n vi 0 i 1 Gry dwuosobowe o sumie zero to takie gry, w których udział biorą tylko dwie strony, a suma wygranych obu graczy równa się zeru. Partia to jednokrotny wybór sposobu działania przez wszystkich graczy. Strategia to reguła podejmowania decyzji, określająca sposób działania gracza. D. Ciołek BADANIA OPERACYJNE – wykład 4 Podstawowe pojęcia Strategia mieszana polega na zastosowaniu wszystkich lub niektórych sposobów działania w pewnej ustalonej proporcji. Jeśli gracz postanawia zastosować tylko jeden sposób działania, mówimy, że stosuje on strategią czystą. Wartość gry to przeciętna kwota, którą gracz mógłby wygrać w ciągu wielu powtarzanych partii, jeżeli wszyscy gracze stosują optymalne strategie. Macierz wypłat (korzyści) to tabela określająca wygrane gracza G1 przy wszystkich możliwych sposobach działania obydwu graczy. Wartość liczbowa aij określona wyborem graczy, reprezentuje kwotę, którą gracz G2 powinien przekazać swojemu przeciwnikowi - graczowi G1. D. Ciołek BADANIA OPERACYJNE – wykład 4 Definicje Rozwiązanie gry wymaga określenia: wartości gry (v), strategii gracza G1 zapewniającej, że przeciętna wygrana w grze jest co najmniej równa wartości gry, strategii gracza G2 zapewniającej, że przeciętna przegrana w grze jest co najwyżej równa wartości gry. Definicja 1 Mówimy, że określona jest gra macierzowa, jeżeli dana jest macierz wypłat A = [aij] o wymiarze m × n, gdzie aij – dowolne liczby rzeczywiste, aij oznacza wypłatę gracza G2 na rzecz gracza G1 przy wyborze odpowiednich sposobów działania, tzn. gracz G1 wybiera wiersz „i”, a gracz G2 – kolumnę „j” w macierzy wypłat. D. Ciołek BADANIA OPERACYJNE – wykład 4 Definicje Definicja 2 Przez strategię mieszaną gracza G1 rozumiemy wektor wierszowy x = [x1, x2, ・ ・ ・ , xm] nieujemnych liczb xi takich, że: xi 0, m xi 1, i 1,2,..., m i 1 Definicja 3 Przez strategię mieszaną gracza G2 rozumiemy wektor kolumnowy u, o elementach uj takich, że: u j 0, n u j 1, j 1 j 1,2,..., n D. Ciołek BADANIA OPERACYJNE – wykład 4 Definicje Definicja 4 Strategia mieszana, której k-ty element jest równy jeden, a pozostałe są równe zeru, jest k-tą strategią czystą gracza. Definicja 5 Jeżeli rozwiązanie gry wymaga, aby każdy z graczy stosował tylko jeden ze sposobów działania, to grę taką nazywamy grą z punktem siodłowym. Definicja 6 Punkt siodłowy to taki punkt w macierzy wypłat, dla którego: v max a min ij max min aij j j i i gdzie minj maxi aij = v2 to górna wartość, a maxi minj aij = v1 dolna wartość gry. D. Ciołek BADANIA OPERACYJNE – wykład 4 Definicje Twierdzenie von Neumanna I: Jeżeli w macierzy wypłat gry istnieje punkt siodłowy to czyste strategie minimaksowe są optymalne. Jeżeli w macierzy wypłat gry nie istnieje punkt siodłowy, to zachodzi: v1 < v < v2 . Definicja 7 Funkcję wypłaty gracza G1 definiujemy jako: m n F xu x A u xi aij u j i 1 j 1 Funkcja wypłaty określa oczekiwaną wartość wygranej gracza G1 w jednej partii przy wielokrotnym podejmowaniu decyzji w sposób losowy. D. Ciołek BADANIA OPERACYJNE – wykład 4 Definicje Twierdzenie von Neumanna II Niech x, u oznaczają mieszane strategie optymalne. Można wykazać, że dla mieszanych strategii optymalnych zachodzi: F xu F xu F xu Ponieważ F x u v , to oznacza, że funkcja wypłaty gracza G1 dla mieszanych strategii optymalnych jest równa wartości gry. D. Ciołek BADANIA OPERACYJNE – wykład 4 Definicje Definicja 8 reguła dominacji Jeżeli wszystkie elementy pewnej kolumny w macierzy wypłat są większe lub równe odpowiednim elementom innej kolumny, to pierwszą z nich nazywamy kolumną zdominowaną. Jeżeli wszystkie elementy pewnego wiersza są mniejsze lub równe odpowiednim elementom innego wiersza, to pierwszy z nich nazywamy wierszem zdominowanym. Zdominowane wiersze lub kolumny usuwamy z macierzy wypłat, co oznacza, że dane sposoby działania będą stosowane z prawdopodobieństwem zero. D. Ciołek BADANIA OPERACYJNE – wykład 4 Przykład 1 Dwóch graczy rozgrywa następującą grę. Każdy gracz wybiera niezależnie od drugiego gracza, jeden z trzech kolorów: biały (B), czarny (C) lub zielony (Z). Po niezależnym dokonaniu wyboru koloru przez obu graczy porównuje się wybrane kolory. Jeżeli obaj gracze wybrali biały, nikt nie wygrywa, jeżeli gracz G1 wybrał biały, a gracz G2 czarny, gracz G1 przegrywa 1 punkt. Wszystkie możliwe wyniki zawarte są w tablicy. B C Z B 0 -1 6 C 2 4 5 Z 1 -2 8 Maksimum Minimum D. Ciołek BADANIA OPERACYJNE – wykład 4 Przykład 2 Należy rozwiązać grę dwuosobową o sumie zero, gdzie symbolami A i B oznaczono obu graczy, a wektory X i Y oznaczają odpowiednio strategie gracz A i B. Wszystkie możliwe wyniki zawarte są w tablicy. Y1 Y2 Y3 X1 2 4 6 X2 3 1 4 X3 2 3 3 Maksimum Minimum D. Ciołek BADANIA OPERACYJNE – wykład 4 Algorytm rozwiązywania gry Algorytm postępowania: czy w macierzy wypłat występuje punkt siodłowy, jeżeli tak – to czyste strategie minimaksowe są optymalne. czy występują wiersze lub kolumny zdominowane, jeżeli tak to usuwamy je z macierzy wypłat. sprawdzić, w jakim przedziale znajduje się wartość gry, zapewnić jej nieujemność, poprzez przekształcenie macierzy A na macierz: A′ = A + |v1| D. Ciołek BADANIA OPERACYJNE – wykład 4 Zastosowanie programowania liniowego Każdą grę dwuosobową o sumie zero, można przedstawić w postaci dwóch modeli programowania liniowego: Dla gracza G1: Dla gracza G2: znaleźć taki nieujemny znaleźć taki nieujemny wektor x, który: wektor u, który: W xu v max W xu v min n m p.w. aij xi v p.w. j 1 i 1 m xi 1 i 1 Oba modele są wobec siebie dualne. a ij u j v n u j 1 j 1 D. Ciołek BADANIA OPERACYJNE – wykład 4 Przykład 3 Każdy z graczy wybiera liczbę ze zbioru {1, 2, 3}. Gracz, który wybrał mniejszą liczbę wygrywa 2 punkty z wyjątkiem przypadku, gdy jego liczba jest dokładnie mniejsza o jeden, wtedy przegrywa 4 punkty. Jeżeli liczby są równe nikt nie wygrywa. Wszystkie możliwe wyniki zawarte są w tablicy. „1” „2” „3” „1” 0 -4 2 „2” 4 0 -4 „3” -2 4 0 Maksimum Minimum D. Ciołek BADANIA OPERACYJNE – wykład 4 Gry z naturą Dwaj gracze: decydent i natura. Natura - nie jest zainteresowana wynikiem gry Reguły decyzyjne: kryterium Walda (reguła maxmin), kryterium Laplace'a - Bayesa, kryterium Hurwicza, kryterium Savage'a, Niech A = [aij ] oznacza macierz wypłat (korzyści). D. Ciołek BADANIA OPERACYJNE – wykład 4 Gry z naturą 1. Kryterium Walda Podejmujemy taką decyzję, przy której minimalna wygrana (ze względu na stan natury) przyjmie wartość największą, tzn. szukamy takiego i0, dla którego: a i0 max min aij i j 2. Kryterium Laplace'a - Bayesa Zakładamy, że wszystkie stany natury są jednakowo prawdopodobne, możliwe jest wyliczenie wartości oczekiwanej wygranej. Najlepsza decyzja, to ta dla której oczekiwany rezultat jest największy. Szukamy takiego i0, dla którego: 1 n Ei0 max aij i n j 1 D. Ciołek BADANIA OPERACYJNE – wykład 4 Gry z naturą 3. Kryterium Hurwicza Wprowadzamy współczynnik optymizmu - skłonności do ryzyka 0,1 , wybieramy tę decyzję i0, dla której: H i0 ( ) max i a min ij j max a ij 1 j W zależności od wartości współczynnika optymizmu, otrzymujemy: 0 1 - reguła pesymistyczna (Walda), - reguła optymistyczna D. Ciołek BADANIA OPERACYJNE – wykład 4 Gry z naturą 4. Kryterium Savage'a Definiujemy macierz żalu lub strat relatywnych. Strata relatywna - różnica pomiędzy maksymalną wygraną przy danym stanie natury, a wygraną wynikającą z podjętej decyzji. Macierz strat relatywnych gdzie: Aˆ aˆ ij aij aˆij max a ij i j 1,2,...,n Wybieramy tę strategię i0, która spełnia postulat minimalizacji strat relatywnych (minimalny maksymalny żal). ˆij aˆi min max a i i 0 D. Ciołek BADANIA OPERACYJNE – wykład 4 Przykład 4 Istnieje możliwość zbudowania czterech typów zakładu usługowego. Koszt eksploatacji zależy od różnych czynników, takich jak: rozwój sytuacji gospodarczej w regionie, stan rynku pracy, przyszłe ceny surowców, oraz efektywny popyt na dany rodzaj usług. Dla każdego z projektowanych zakładów oszacowano koszty eksploatacji w trzech wariantach: najmniej korzystnym (S1), umiarkowanym (S2), sprzyjającym (S3). Tablica prezentuje oszacowane poziomy kosztów eksploatacji zakładów. „S1” „S2” „S3” „Z1” 40 35 25 „Z2” 50 30 25 „Z3” 65 20 20 „Z4” 70 20 14