Zajęcia na międzyszkolne kółko — wartość oczekiwana (szkic) Cóż to jest wartość oczekiwana? Nie wdając się w formalne definicje napiszę, że jest to średni wynik jakiegoś losowania. Żeby móc mówić o wartości oczekiwanej, losowanie musi mieć wyniki liczbowe — nie można np. mówić o wartości oczekiwanej wyniku rzutu monetą, ale można — o wartości oczekiwanej wyniku rzutu kostką. Trzeba pamiętać, że wartość oczekiwana to nie najczęściej wypadający wynik, tylko średni. Na przykład jeśli mówimy o wartości oczekiwanej wygranej w pewnej loterii, w której jest 500 losów, w tym jeden wygrywający i wygrywa się na nim 500 złotych, to wartość oczekiwana wygranej to złotówka. Widać tu różnicę między prawdopodobieństwem (które mówi, jak często będziemy wygrywać, i w tym wypadku wynosi 1 ) a wartością oczekiwaną, która mówi, ile średnio wygramy. 500 Obliczanie wartości oczekiwanej — technika “na palcach” Jak obliczać wartość oczekiwaną? Najprostsze jest to wtedy, gdy możliwych wyników jest skończenie wiele. Wtedy patrzymy, z jakim prawdopodobieństwem wypadnie dany wynik, mnożymy ten wynik przez to prawdopodobieństwo i sumujemy (jeśli ktoś od tłumaczeń słownych woli P wzorki, to E(X) = pi xi , gdzie pi = P (X = xi )). Obliczmy dla przykładu wartość oczekiwaną liczby oczek przy rzucie kostką. Prawdopodobieństwo uzyskania dowolnego wyniku to 16 , zatem wartość oczekiwana to 61 · 1 + 61 · 2 + . . . + 61 · 6 = 16 · 21 = 3.5. Jak widać, wartość oczekiwana może przyjmować nieoczekiwane wartości — w tym przykładzie, choć zawsze wypadała całkowita liczba oczek, wartość oczekiwana bynajmniej całkowita nie była (jeśli kogoś to dziwi, to niech zwróci uwagę na to, że średnia liczb całkowitych często jest niecałkowita — np. średnia liczba dzieci w rodzinie). Jeżeli wyników jest nieskończenie wiele, to postępujemy podobnie. Rozważmy następującą sytuację — rzucamy monetą tak długo, aż wypadnie pierwszy orzeł. Interesuje nas wartość oczekiwana liczby rzutów. Prawdopodobieństwo, że będziemy czekać dokładnie n rzutów to dokładnie 21n — w n − 1 pierwszych rzutach musi wciąż wypadać reszka, w ostatnim zaś orzeł. Zatem E = 21 · 1 + 14 · 2 + 81 · 3 + . . . + 21n · n + . . . = 2 (zagadka — dlaczego). Może też okazać się, że wartość oczekiwana wynosi ∞. Popatrzmy np. na grę (1), w której rzucamy monetą tak długo, aż wypadnie orzeł, i jeśli wypadnie w n-tym rzucie, to wygrywam 2n złotych. Wartość oczekiwana wygranej = 21 · 2 + 41 · 4 + . . . + 21n · 2n + . . . = 1 + 1 + 1 + . . . = ∞. Wypada tu dodać, że wartość oczekiwana nie zawsze istnieje. Gdyby na przykład poprzednią grę zmodyfikować tak, że gdy orzeł wypada po parzystej liczbie rzutów, wygrywamy 2n złotych, zaś gdy wypada po nieparzystej — przegrywamy 2n złotych, to wartość oczekiwana wynosiłaby 1 − − − 1 + 1 − − − 1 + . . ., co nie daje żadnej sensownej liczby. Na końcu zamieściłem parę uwag o tym, kiedy można się takiej sytuacji spodziewać i jak dowiadywać się, czy nie zachodzi, na razie jednak będziemy zakładać, że wartości oczekiwane, które obliczamy istnieją i nie będziemy się kłopotać tym, że mogłoby być inaczej. Technika rekurencyjna Teraz poznamy parę bardziej wyrafinowanych sposobów obliczania wartości oczekiwanej. Zacznijmy od techniki rekurencyjnej. Rozważmy taką sytuację — rzucamy kostką tak długo, aż wypadnie szóstka. Jak długo średnio będziemy czekać? Można — jak poprzednio — wypisać nieskończoną sumę i zbadać, ile wynosi. Można jednak rozumować następująco: załóżmy, że na szóstkę czeka się średnio E rzutów. W pierwszym rzucie szóstka wypada z prawdopodobieństwem 61 . Gdy nie wypadła szóstka, to wykonaliśmy jeden rzut, i musimy czekać dalej. Ale w wyniku tego jednego rzutu nic się nie zmieniło, czyli nadal — średnio — na szóstkę będziemy czekać E rzutów. Zatem mamy równanie E = 61 · 1 + 56 (1 + E), z którego otrzymujemy E = 6. Zadanie 1: Ile czasu będziemy średnio czekać na zdarzenie, które w każdej minucie zachodzi z prawdopodobieństwem p? Rozwiążmy tą techniką trochę trudniejsze zadanie, pochodzące z obozu przygotowawczego do zawodów miedzynarodowych Zwardoń ’97. W chwili t = 0 w wierzchołkach trójkąta stoją trzy osoby, każda w innym wierzchołku. W kolejnych chwilach t = 1, 2, . . . każda z nich losowo (z prawdopodobieństwem 21 przemieszcza się do jednego z sąsiednich wierzchołków. Jaka jest wartość oczekiwana czasu, po którym wszystkie trzy spotkają się w jednym wierzchołku? Oznaczmy szukaną wartość oczekiwaną przez E. W pierwszym ruchu nie uda się im spotkać — z każdego wierzchołka ktoś wychodzi, a zatem w żadnym nie będzie wszystkich trzech osób. Czy można zatem wywnioskować, że nigdy się nie spotkają? Oczywiście nie (np. jeśli w pierwszym ruchu A i B pójdą do wierzchołka C, zaś C do A, zaś w drugim ruchu — wszyscy pójdą do B). Co zatem się zmienia w tej sytuacji? W wyprodukowanym przykładzie po pierwszym ruchu w pewnym wierzchołku nikogo nie było, co umożliwiło w końcu spotkanie. Zatem zanim dojdzie do spotkania, pewien wierzchołek musi opustoszeć. Obliczmy, jak długo będziemy na to czekać. Prawdopodobieństwo, że w jednym ruchu trzy osoby ruszą się tak, by któryś wierzchołek opustoszał wynosi 43 . Zatem — oznaczając przez E1 czas oczekiwania na opustoszenie jednego wierzchołka — E1 = 43 · 1 + 14 · (E1 + 1), z czego dostajemy E1 = 43 . Teraz obliczmy E2 — czas czekania na to, aż wszyscy się spotkają, jeśli zaczynamy z sytuacji, gdy dwie osoby są w jednym wierzchołku, trzecia zaś — w innym. Z dotychczasowych rachunków wiemy, że E = 34 + E2 . Otóż prawdopodobieństwo, że się spotkają po jednym ruchu to 18 . Prawdopodobieństwo, że po jednym ruchu w każdym wierzchołku będzie jedna osoba to 14 . Prawdopodobieństwo, że w pewnym wierzchołku będą dwie osoby — 58 . Zatem E2 = 18 · 1 + 14 (1 + E) + 85 (1 + E2 ), co po , czyli E = 12. podstawieniu E = 43 + E2 i pewnej dozie rachunków daje E2 = 32 3 Rozbijanie na sumy Wartość oczekiwana ma bardzo wygodną własność — jeżeli mamy dwa losowania, i interesuje nas średni wynik ich sumy, to jest on sumą średnich wyników poszczególnych losowań (ujęte we wzór przedstawia się to jako E(X + Y ) = E(X) + E(Y )). Nie jest to zaskakująca własność, lecz jest bardzo pożyteczna. Dla przykładu — jeżeli interesuje nas średnia liczba oczek wyrzuconych na 10 kostkach sześciościennych, to zamiast wypisywać wszystkie możliwe kombinacje i sumować je z odpowiednimi prawdopodobieństwami (a kombinacji tych jest zastraszająco dużo) wystarczy zauważyć, że na pojedynczej kostce wypadało średnio 3.5, zatem na dziesięciu wypadnie średnio 3.5 · 10 = 35. I tyle. Trochę bardziej zaskakujący może wydać się fakt, że wzór ten zachodzi również, gdy między dwoma zdarzeniami zachodzi jakiś związek. Dla przykłądu — jeśli średni wzrost człowieka to 170 cm, zaś średni obwód w pasie to 90 cm, to jeżeli wybierzemy losowego człowieka, to średnio suma jego wzrostu i obwodu w pasie wyniesie 260 cm. I nie będzie miało na to żadnego znaczenia to, czy ludzie wysocy są zazwyczaj grubsi, czy chudsi. Rozwiążmy dla przykładu następujące zadanie z 36. Olimpiady Matematycznej: W urnie jest 1985 kartek, na których napisane są liczby 1, 2, 3, . . . , 1985, każda liczba na jednej kartce. Losujemy bez zwracania 100 kartek. Znaleźć wartość oczekiwaną sumy liczb napisanych na wylosowanych kartkach. Można — oczywiście — w ten czy inny sposób postarać się rozważyć wszystkie możliwe wyniki tego losowania, zauważyć parę faktów, poupraszczać (co nie jest zupełnie banalne) i otrzymać rezultat. Jest jednak szybsza droga. Wylosujmy jedną kartkę. Wartość oczekiwana 1 (1 + 2 + . . . + 1985) = 993. Trzeba jeszcze zauważyć, że nie zależy zapisanej na niej liczby to 1985 to od tego, jako którą losujemy tę kartkę — zatem dla każdej z naszych stu kartek wartość oczekiwana to 993. Zatem wartość oczekiwana sumy to 99300. Tu może mała dygresja — zdziwić kogoś może fakt, że wartość oczekiwana jest taka sama w drugim, trzecim, czy dowolnym innym losowaniu (jeśli dla kogoś jest to jasne, to zapewne może nie czytać tego akapitu). Przeprowadźmy zatem następujący eksperyment myślowy: weźmy nasze 1985 kartek, i wylosujmy jedną z nich, lecz nie patrzmy na nią. Następnie (bez zwracania) wylosujmy kolejną. Czy na prawdopodobieństwa jakkolwiek wpływa fakt, że przedtem coś wylosowaliśmy? Otóż nie — jeśli ktoś nie wierzy, to niech wrzuci wylosowaną jako pierwszą kartkę spowrotem do worka z którego losuje (wciąż na nią nie patrząc) i jest w takiej sytuacji, jakby trzymaną w ręku kartkę wylosował jako pierwszą (jeśli kogoś i to nie przekonuje, to trudno — musi po prostu wykonać rachunki i zobaczyć, że faktycznie tak jest). Oczywiście, wyniki poszczególnych losowań mają wpływ na siebie nawzajem — lecz, jak było powiedziane, to nie zmienia wartości oczekiwanej. Obliczymy tą techniką jeszcze jeden przykład, w którym wykorzystana zostanie ona w sposób trochę sztuczny, ale za to dość efektowny. Rozważmy następującą sytuację: w pewnym pomieszczeniu stoi n mężczyzn, którzy na dany sygnał podrzucają swoje kapelusze do góry, po czym każdy z nich łapie losowy ze spadających kapeluszy. Ilu z nich średnio trafi na swój kapelusz? Próby zrobienia tego zadania “siłowo”, tj. przez obliczenie prawdopodobieństw wszystkich możliwych wyników, są żmudne i niełatwe — wymagają sporo wprawy oraz czasu. Spójrzmy jednak na pewnego ustalonego mężczyznę. Złapie on losowy kapelusz, zatem własny złapie z prawdopodobieństwem n1 . Zatem gdyby interesował nas tylko ten mężczyzna, to wartość oczekiwana wynosiłaby n1 — jest to wartość oczekiwana liczby własnych kapeluszy złapanych przez tego konkretnego mężczynzę (jakkolwiek niezręcznie to brzmi). Nas zaś interesuje wartość oczekiwana liczby własnych kapeluszy złapanych przez wszystkich mężczyzn. Mamy n mężczyzn, każdy średnio łapie n1 własnego kapelusza, zatem łącznie liczba mężczyzn, którzy złapią własny kapelusz średnio wyniesie 1. Ta technika — polegająca na rozbiciu pewnej wartości oczekiwanej na sumę innych — dość sztucznie na pierwszy rzut oka wyglądających — reprezentujących poszczególne elementy tej sumy jest jedną bardziej efektownych. I zdecydowanie warto ją zapamiętać. Istnienie wartości oczekiwanej Zgodnie z zapowiedzią na koniec dorzucę parę słów o istnieniu wartości oczekiwanej. Wartość oczekiwana jest sumą pewnych liczb (przynajmniej w wypadkach, które rozważaliśmy). Jeżeli ta suma jest skończona, to nie może się stać nic złego - wartość oczekiwana będzie istniała. Problemy mogą zaistnieć dopiero przy sumach nieskończonych (bo — jak widzieliśmy - nieskończone sumy liczb nie zawsze są dobrze określone). O ile wszystkie sumowane liczby są dodatnie, to w najgorszym wypadku dostaniemy +∞. Jeśli trafiają się też ujemne, trzeba formalnie badać zbieżność sumy. Jest na to wiele sposobów, których nie będę tu opisywał. Najprostszym jest tzw. kryterium d’Alamberta — jeśli chcemy policzyć a1 + a2 + a3 + . . ., to wystarczy zbadać n| . Jeśli ta jest mniejsza niż 1, to suma będzie istniała. W szczególności wynika z granicę |a|an+1 | niego, że sumy Wc(1) + Wc(2) + Wc(3) + . . . + Wc(n) 1 2 3 n , gdzie W jest wielomianem, zaś c > 1 istnieją (wystarcza to, by sprawdzić, że wszystkie rozważane przez nas dotychczas wartości oczekiwane istnieją). Zastanówmy się jeszcze, jaki to ma wpływ na stosowane przez nas techniki. Oczywiście, jeśli wartość oczekiwana nie istnieje, to technika “na palcach” oczywiście to wykaże. Problemy mogą występować przy rekurencyjnym liczeniu wartości oczekiwanej, gdy ta nie istnieje bądź równa jest ±∞. Dla przykładu spróbujmy rekurencyjnie policzyć wartości oczekiwane wygranej w grach, które służyły nam za przykłady tego, że wartość oczekiwana nie musi istnieć. Przypomnijmy — rzucaliśmy tam monetą aż do wypadnięcia orła, i w zalężności od tego, w którym rzucie wypadł zyskiwaliśmy pewną sumę pieniędzy. Gdy suma ta była równa 2n (czyli wartość oczekiwana to +∞) technika rekurencyjna daje E = 1 + 21 · 2E, czyli E = E + 1. Otrzymaliśmy sprzeczność, co informuje nas, że coś jest zdecydowanie nie w porządku. Gdyby zmienić ciut zasady tak, by wygrana była równa 4n , to otrzymalibyśmy E = 1 + 12 · 4E, czyli E = −1. Tu co prawda otrzymaliśmy jakiś wynik, choć ewidentnie bezsensowny. Ogólnie - jeżeli wartość oczekiwana wynosi +∞, to technika rekurencyjna może dać jakiś wynik, ale prawie zawsze będzie on absurdalny. Spójrzmy jeszcze, co się dzieje, gdy wartość oczekiwana nie istnieje. W naszej grze miało to miejsce, gdy wygraną było (−1)n · 2n . Wtedy technika rekurencyjna daje E = 1 + 12 · (−2E), czyli E = 12 , w co już dałoby się uwierzyć. Stąd płyną dwa wnioski — po pierwsze, przed użyciem techniki rekurencyjnej trzeba wiedzieć, że wartość oczekiwana istnieje, po drugie zaś, jeśli w wyniku jej użycia wychodzi wynik dalece sprzeczny z intuicją, należy zastanowić się, czy nie zapomnieliśmy o wniosku pierwszym. Sytuacja jest o wiele prostsza, gdy liczymy wartość oczekiwaną rozbijając na sumę. O ile uda nam się w ten sposób dojść do wyniku, to będzie on poprawny. Czemu? Załóżmy, że tak nie jest, tj. zmienna losowa X rozbija się na sumę X1 + . . . + Xn a wartość oczekiwana X nie istnieje lub też jest nieskończona. Wtedy któraś z Xi musi mieć nieokreśloną lub nieskończoną wartość oczekiwaną. Założyliśmy jednak, że wszystkie te wartości oczekiwane udało nam się policzyć, zatem i X musi mieć skończoną wartość oczekiwaną. Na samym końcu dla przykładu udowodnijmy, że wartość oczekiwana w zadaniu z chodzeniem po trójkącie istnieje i jest skończona. Próba bezpośredniego wypisania szeregu jest skazana na niepowodzenie (gdyby się to udało, to całe rekurencyjne machinacje byłyby zbędne). Ale zauważmy, że z każdej pozycji prawdopodobieństwo dojścia w dwóch ruchach do spotkania 1 . Zatem czas oczekiwania na spotkanie w parzystej liczbie ruchów (czyli na jest większe niż 32 P zdarzenie mniej prawdopodobne) to mniej niż ( 31 )n · n, która to suma jest skończona. Na 32 zdarzenie, które wystąpi w tym samym momencie lub wcześniej będziemy czekać nie dłużej, a w każdym razie skończoną ilość czasu. Zadania 1. (wspomniane już w tekście): Ile czasu będziemy średnio czekać na zdarzenie, które w każdej minucie zachodzi z prawdopodobieństwem p? 2. (37. OM, pierwszy etap): Rzucamy kostką najpierw raz, a następnie tyle razy, ile oczek wypadło przy pierwszym rzucie. Obliczyć wartość oczekiwaną sumy wyrzuconych oczek (łącznie z pierwszym rzutem). 3. (40. OM, finał): Niech n, k będą dodatnimi liczbami całkowitymi. Tworzymy ciąg zbiorów A0 , A1 , . . . , Ak przyjmując, że A0 = {1, 2, . . . , n}, a dla i = 1, 2, . . . , k zbiór Ak jest losowo wybranym podzbiorem Ai−1 , przy czym wybór każdego podzbioru jest jednakowo prawdopodobny. Rozpatrujemy zmienną losową równą liczbie elementów zbioru Ak . Dowieść, że jej wartość oczekiwana jest równa n2−k . 4. Karty z napisanymi na nich liczbami od 1 do n tasujemy, a następnie rozkładamy je na stosy. Pierwsza karta stanowi początek pierwszego stosu. Dla i ­ 2 jeśli liczba na i-tej karcie jest większa niż liczba na i − 1-wszej, to i-tą kartę kładziemy na ten sam stos, co i − 1wszą, w przeciwnym zaś wypadku i-ta karta stanowi początek kolejnego stosu. Obliczyć wartość oczekiwaną liczby stosów. 5. (zmodyfikowane zadanie z OM): Wypisujemy kolejno wyrazy ciągu (n1 , n2 , . . . , nk ), gdzie n1 = 1000, zaś nj dla j > 1 jest liczbą całkowitą wybraną losowo z przedziału [0, nj−1 −1] (wybór każdej liczby z tego przedziału jest jednakowo prawdopodobny). Kończymy wypisywanie, gdy wybrana liczba jest zerem, tzn. nk−1 6= 0, nk = 0. Długość k ciągu (n1 , n2 , . . . , nk ) jest zmienną 1 losową. Udowodnić, że jej wartość oczekiwana jest równa 1 + 21 + . . . + 1000 . 6. Ze zbioru {1, 2, . . . , n} wybieramy losowo bez zwracania k liczb (k ¬ n). Oblicz wartość oczekiwaną różnicy między największą a najmniejszą z wylosowanych liczb.