wartość oczekiwana

advertisement
Zajęcia na międzyszkolne kółko — wartość oczekiwana (szkic)
Cóż to jest wartość oczekiwana? Nie wdając się w formalne definicje napiszę, że jest to średni
wynik jakiegoś losowania. Żeby móc mówić o wartości oczekiwanej, losowanie musi mieć wyniki
liczbowe — nie można np. mówić o wartości oczekiwanej wyniku rzutu monetą, ale można —
o wartości oczekiwanej wyniku rzutu kostką. Trzeba pamiętać, że wartość oczekiwana to nie
najczęściej wypadający wynik, tylko średni. Na przykład jeśli mówimy o wartości oczekiwanej
wygranej w pewnej loterii, w której jest 500 losów, w tym jeden wygrywający i wygrywa się
na nim 500 złotych, to wartość oczekiwana wygranej to złotówka. Widać tu różnicę między
prawdopodobieństwem (które mówi, jak często będziemy wygrywać, i w tym wypadku wynosi
1
) a wartością oczekiwaną, która mówi, ile średnio wygramy.
500
Obliczanie wartości oczekiwanej — technika “na palcach”
Jak obliczać wartość oczekiwaną? Najprostsze jest to wtedy, gdy możliwych wyników jest
skończenie wiele. Wtedy patrzymy, z jakim prawdopodobieństwem wypadnie dany wynik, mnożymy
ten wynik przez to prawdopodobieństwo i sumujemy (jeśli ktoś od tłumaczeń słownych woli
P
wzorki, to E(X) = pi xi , gdzie pi = P (X = xi )). Obliczmy dla przykładu wartość oczekiwaną
liczby oczek przy rzucie kostką. Prawdopodobieństwo uzyskania dowolnego wyniku to 16 , zatem
wartość oczekiwana to 61 · 1 + 61 · 2 + . . . + 61 · 6 = 16 · 21 = 3.5.
Jak widać, wartość oczekiwana może przyjmować nieoczekiwane wartości — w tym przykładzie,
choć zawsze wypadała całkowita liczba oczek, wartość oczekiwana bynajmniej całkowita nie
była (jeśli kogoś to dziwi, to niech zwróci uwagę na to, że średnia liczb całkowitych często jest
niecałkowita — np. średnia liczba dzieci w rodzinie).
Jeżeli wyników jest nieskończenie wiele, to postępujemy podobnie. Rozważmy następującą
sytuację — rzucamy monetą tak długo, aż wypadnie pierwszy orzeł. Interesuje nas wartość
oczekiwana liczby rzutów. Prawdopodobieństwo, że będziemy czekać dokładnie n rzutów to
dokładnie 21n — w n − 1 pierwszych rzutach musi wciąż wypadać reszka, w ostatnim zaś orzeł.
Zatem E = 21 · 1 + 14 · 2 + 81 · 3 + . . . + 21n · n + . . . = 2 (zagadka — dlaczego). Może też okazać
się, że wartość oczekiwana wynosi ∞. Popatrzmy np. na grę (1), w której rzucamy monetą tak
długo, aż wypadnie orzeł, i jeśli wypadnie w n-tym rzucie, to wygrywam 2n złotych. Wartość
oczekiwana wygranej = 21 · 2 + 41 · 4 + . . . + 21n · 2n + . . . = 1 + 1 + 1 + . . . = ∞.
Wypada tu dodać, że wartość oczekiwana nie zawsze istnieje. Gdyby na przykład poprzednią
grę zmodyfikować tak, że gdy orzeł wypada po parzystej liczbie rzutów, wygrywamy 2n złotych,
zaś gdy wypada po nieparzystej — przegrywamy 2n złotych, to wartość oczekiwana wynosiłaby
1 − − − 1 + 1 − − − 1 + . . ., co nie daje żadnej sensownej liczby. Na końcu zamieściłem parę uwag
o tym, kiedy można się takiej sytuacji spodziewać i jak dowiadywać się, czy nie zachodzi, na
razie jednak będziemy zakładać, że wartości oczekiwane, które obliczamy istnieją i nie będziemy
się kłopotać tym, że mogłoby być inaczej.
Technika rekurencyjna
Teraz poznamy parę bardziej wyrafinowanych sposobów obliczania wartości oczekiwanej.
Zacznijmy od techniki rekurencyjnej. Rozważmy taką sytuację — rzucamy kostką tak długo,
aż wypadnie szóstka. Jak długo średnio będziemy czekać?
Można — jak poprzednio — wypisać nieskończoną sumę i zbadać, ile wynosi. Można jednak
rozumować następująco: załóżmy, że na szóstkę czeka się średnio E rzutów. W pierwszym rzucie
szóstka wypada z prawdopodobieństwem 61 . Gdy nie wypadła szóstka, to wykonaliśmy jeden
rzut, i musimy czekać dalej. Ale w wyniku tego jednego rzutu nic się nie zmieniło, czyli nadal —
średnio — na szóstkę będziemy czekać E rzutów. Zatem mamy równanie E = 61 · 1 + 56 (1 + E),
z którego otrzymujemy E = 6.
Zadanie 1: Ile czasu będziemy średnio czekać na zdarzenie, które w każdej minucie zachodzi
z prawdopodobieństwem p?
Rozwiążmy tą techniką trochę trudniejsze zadanie, pochodzące z obozu przygotowawczego
do zawodów miedzynarodowych Zwardoń ’97. W chwili t = 0 w wierzchołkach trójkąta stoją
trzy osoby, każda w innym wierzchołku. W kolejnych chwilach t = 1, 2, . . . każda z nich losowo
(z prawdopodobieństwem 21 przemieszcza się do jednego z sąsiednich wierzchołków. Jaka jest
wartość oczekiwana czasu, po którym wszystkie trzy spotkają się w jednym wierzchołku?
Oznaczmy szukaną wartość oczekiwaną przez E. W pierwszym ruchu nie uda się im spotkać
— z każdego wierzchołka ktoś wychodzi, a zatem w żadnym nie będzie wszystkich trzech osób.
Czy można zatem wywnioskować, że nigdy się nie spotkają? Oczywiście nie (np. jeśli w pierwszym ruchu A i B pójdą do wierzchołka C, zaś C do A, zaś w drugim ruchu — wszyscy pójdą
do B). Co zatem się zmienia w tej sytuacji? W wyprodukowanym przykładzie po pierwszym
ruchu w pewnym wierzchołku nikogo nie było, co umożliwiło w końcu spotkanie. Zatem zanim
dojdzie do spotkania, pewien wierzchołek musi opustoszeć. Obliczmy, jak długo będziemy na to
czekać. Prawdopodobieństwo, że w jednym ruchu trzy osoby ruszą się tak, by któryś wierzchołek
opustoszał wynosi 43 . Zatem — oznaczając przez E1 czas oczekiwania na opustoszenie jednego
wierzchołka — E1 = 43 · 1 + 14 · (E1 + 1), z czego dostajemy E1 = 43 . Teraz obliczmy E2 — czas
czekania na to, aż wszyscy się spotkają, jeśli zaczynamy z sytuacji, gdy dwie osoby są w jednym
wierzchołku, trzecia zaś — w innym. Z dotychczasowych rachunków wiemy, że E = 34 + E2 .
Otóż prawdopodobieństwo, że się spotkają po jednym ruchu to 18 . Prawdopodobieństwo, że
po jednym ruchu w każdym wierzchołku będzie jedna osoba to 14 . Prawdopodobieństwo, że w
pewnym wierzchołku będą dwie osoby — 58 . Zatem E2 = 18 · 1 + 14 (1 + E) + 85 (1 + E2 ), co po
, czyli E = 12.
podstawieniu E = 43 + E2 i pewnej dozie rachunków daje E2 = 32
3
Rozbijanie na sumy
Wartość oczekiwana ma bardzo wygodną własność — jeżeli mamy dwa losowania, i interesuje nas średni wynik ich sumy, to jest on sumą średnich wyników poszczególnych losowań
(ujęte we wzór przedstawia się to jako E(X + Y ) = E(X) + E(Y )). Nie jest to zaskakująca
własność, lecz jest bardzo pożyteczna. Dla przykładu — jeżeli interesuje nas średnia liczba
oczek wyrzuconych na 10 kostkach sześciościennych, to zamiast wypisywać wszystkie możliwe
kombinacje i sumować je z odpowiednimi prawdopodobieństwami (a kombinacji tych jest zastraszająco dużo) wystarczy zauważyć, że na pojedynczej kostce wypadało średnio 3.5, zatem
na dziesięciu wypadnie średnio 3.5 · 10 = 35. I tyle.
Trochę bardziej zaskakujący może wydać się fakt, że wzór ten zachodzi również, gdy między
dwoma zdarzeniami zachodzi jakiś związek. Dla przykłądu — jeśli średni wzrost człowieka to
170 cm, zaś średni obwód w pasie to 90 cm, to jeżeli wybierzemy losowego człowieka, to średnio
suma jego wzrostu i obwodu w pasie wyniesie 260 cm. I nie będzie miało na to żadnego znaczenia
to, czy ludzie wysocy są zazwyczaj grubsi, czy chudsi.
Rozwiążmy dla przykładu następujące zadanie z 36. Olimpiady Matematycznej: W urnie
jest 1985 kartek, na których napisane są liczby 1, 2, 3, . . . , 1985, każda liczba na jednej kartce.
Losujemy bez zwracania 100 kartek. Znaleźć wartość oczekiwaną sumy liczb napisanych na
wylosowanych kartkach.
Można — oczywiście — w ten czy inny sposób postarać się rozważyć wszystkie możliwe
wyniki tego losowania, zauważyć parę faktów, poupraszczać (co nie jest zupełnie banalne) i
otrzymać rezultat. Jest jednak szybsza droga. Wylosujmy jedną kartkę. Wartość oczekiwana
1
(1 + 2 + . . . + 1985) = 993. Trzeba jeszcze zauważyć, że nie zależy
zapisanej na niej liczby to 1985
to od tego, jako którą losujemy tę kartkę — zatem dla każdej z naszych stu kartek wartość
oczekiwana to 993. Zatem wartość oczekiwana sumy to 99300.
Tu może mała dygresja — zdziwić kogoś może fakt, że wartość oczekiwana jest taka sama w
drugim, trzecim, czy dowolnym innym losowaniu (jeśli dla kogoś jest to jasne, to zapewne może
nie czytać tego akapitu). Przeprowadźmy zatem następujący eksperyment myślowy: weźmy
nasze 1985 kartek, i wylosujmy jedną z nich, lecz nie patrzmy na nią. Następnie (bez zwracania) wylosujmy kolejną. Czy na prawdopodobieństwa jakkolwiek wpływa fakt, że przedtem coś
wylosowaliśmy? Otóż nie — jeśli ktoś nie wierzy, to niech wrzuci wylosowaną jako pierwszą
kartkę spowrotem do worka z którego losuje (wciąż na nią nie patrząc) i jest w takiej sytuacji, jakby trzymaną w ręku kartkę wylosował jako pierwszą (jeśli kogoś i to nie przekonuje,
to trudno — musi po prostu wykonać rachunki i zobaczyć, że faktycznie tak jest). Oczywiście,
wyniki poszczególnych losowań mają wpływ na siebie nawzajem — lecz, jak było powiedziane,
to nie zmienia wartości oczekiwanej.
Obliczymy tą techniką jeszcze jeden przykład, w którym wykorzystana zostanie ona w
sposób trochę sztuczny, ale za to dość efektowny. Rozważmy następującą sytuację: w pewnym
pomieszczeniu stoi n mężczyzn, którzy na dany sygnał podrzucają swoje kapelusze do góry,
po czym każdy z nich łapie losowy ze spadających kapeluszy. Ilu z nich średnio trafi na swój
kapelusz?
Próby zrobienia tego zadania “siłowo”, tj. przez obliczenie prawdopodobieństw wszystkich
możliwych wyników, są żmudne i niełatwe — wymagają sporo wprawy oraz czasu. Spójrzmy jednak na pewnego ustalonego mężczyznę. Złapie on losowy kapelusz, zatem własny złapie z prawdopodobieństwem n1 . Zatem gdyby interesował nas tylko ten mężczyzna, to wartość oczekiwana
wynosiłaby n1 — jest to wartość oczekiwana liczby własnych kapeluszy złapanych przez tego
konkretnego mężczynzę (jakkolwiek niezręcznie to brzmi). Nas zaś interesuje wartość oczekiwana liczby własnych kapeluszy złapanych przez wszystkich mężczyzn. Mamy n mężczyzn,
każdy średnio łapie n1 własnego kapelusza, zatem łącznie liczba mężczyzn, którzy złapią własny
kapelusz średnio wyniesie 1.
Ta technika — polegająca na rozbiciu pewnej wartości oczekiwanej na sumę innych — dość
sztucznie na pierwszy rzut oka wyglądających — reprezentujących poszczególne elementy tej
sumy jest jedną bardziej efektownych. I zdecydowanie warto ją zapamiętać.
Istnienie wartości oczekiwanej
Zgodnie z zapowiedzią na koniec dorzucę parę słów o istnieniu wartości oczekiwanej. Wartość
oczekiwana jest sumą pewnych liczb (przynajmniej w wypadkach, które rozważaliśmy). Jeżeli ta
suma jest skończona, to nie może się stać nic złego - wartość oczekiwana będzie istniała. Problemy mogą zaistnieć dopiero przy sumach nieskończonych (bo — jak widzieliśmy - nieskończone
sumy liczb nie zawsze są dobrze określone). O ile wszystkie sumowane liczby są dodatnie, to
w najgorszym wypadku dostaniemy +∞. Jeśli trafiają się też ujemne, trzeba formalnie badać
zbieżność sumy. Jest na to wiele sposobów, których nie będę tu opisywał. Najprostszym jest
tzw. kryterium d’Alamberta — jeśli chcemy policzyć a1 + a2 + a3 + . . ., to wystarczy zbadać
n|
. Jeśli ta jest mniejsza niż 1, to suma będzie istniała. W szczególności wynika z
granicę |a|an+1
|
niego, że sumy Wc(1)
+ Wc(2)
+ Wc(3)
+ . . . + Wc(n)
1
2
3
n , gdzie W jest wielomianem, zaś c > 1 istnieją
(wystarcza to, by sprawdzić, że wszystkie rozważane przez nas dotychczas wartości oczekiwane
istnieją).
Zastanówmy się jeszcze, jaki to ma wpływ na stosowane przez nas techniki. Oczywiście,
jeśli wartość oczekiwana nie istnieje, to technika “na palcach” oczywiście to wykaże. Problemy
mogą występować przy rekurencyjnym liczeniu wartości oczekiwanej, gdy ta nie istnieje bądź
równa jest ±∞. Dla przykładu spróbujmy rekurencyjnie policzyć wartości oczekiwane wygranej
w grach, które służyły nam za przykłady tego, że wartość oczekiwana nie musi istnieć. Przypomnijmy — rzucaliśmy tam monetą aż do wypadnięcia orła, i w zalężności od tego, w którym
rzucie wypadł zyskiwaliśmy pewną sumę pieniędzy. Gdy suma ta była równa 2n (czyli wartość
oczekiwana to +∞) technika rekurencyjna daje E = 1 + 21 · 2E, czyli E = E + 1. Otrzymaliśmy
sprzeczność, co informuje nas, że coś jest zdecydowanie nie w porządku. Gdyby zmienić ciut
zasady tak, by wygrana była równa 4n , to otrzymalibyśmy E = 1 + 12 · 4E, czyli E = −1.
Tu co prawda otrzymaliśmy jakiś wynik, choć ewidentnie bezsensowny. Ogólnie - jeżeli wartość
oczekiwana wynosi +∞, to technika rekurencyjna może dać jakiś wynik, ale prawie zawsze
będzie on absurdalny. Spójrzmy jeszcze, co się dzieje, gdy wartość oczekiwana nie istnieje. W
naszej grze miało to miejsce, gdy wygraną było (−1)n · 2n . Wtedy technika rekurencyjna daje
E = 1 + 12 · (−2E), czyli E = 12 , w co już dałoby się uwierzyć. Stąd płyną dwa wnioski — po
pierwsze, przed użyciem techniki rekurencyjnej trzeba wiedzieć, że wartość oczekiwana istnieje,
po drugie zaś, jeśli w wyniku jej użycia wychodzi wynik dalece sprzeczny z intuicją, należy
zastanowić się, czy nie zapomnieliśmy o wniosku pierwszym.
Sytuacja jest o wiele prostsza, gdy liczymy wartość oczekiwaną rozbijając na sumę. O ile
uda nam się w ten sposób dojść do wyniku, to będzie on poprawny. Czemu? Załóżmy, że tak
nie jest, tj. zmienna losowa X rozbija się na sumę X1 + . . . + Xn a wartość oczekiwana X nie
istnieje lub też jest nieskończona. Wtedy któraś z Xi musi mieć nieokreśloną lub nieskończoną
wartość oczekiwaną. Założyliśmy jednak, że wszystkie te wartości oczekiwane udało nam się
policzyć, zatem i X musi mieć skończoną wartość oczekiwaną.
Na samym końcu dla przykładu udowodnijmy, że wartość oczekiwana w zadaniu z chodzeniem po trójkącie istnieje i jest skończona. Próba bezpośredniego wypisania szeregu jest skazana
na niepowodzenie (gdyby się to udało, to całe rekurencyjne machinacje byłyby zbędne). Ale
zauważmy, że z każdej pozycji prawdopodobieństwo dojścia w dwóch ruchach do spotkania
1
. Zatem czas oczekiwania na spotkanie w parzystej liczbie ruchów (czyli na
jest większe niż 32
P
zdarzenie mniej prawdopodobne) to mniej niż ( 31
)n · n, która to suma jest skończona. Na
32
zdarzenie, które wystąpi w tym samym momencie lub wcześniej będziemy czekać nie dłużej, a
w każdym razie skończoną ilość czasu.
Zadania
1. (wspomniane już w tekście): Ile czasu będziemy średnio czekać na zdarzenie, które w
każdej minucie zachodzi z prawdopodobieństwem p?
2. (37. OM, pierwszy etap): Rzucamy kostką najpierw raz, a następnie tyle razy, ile oczek
wypadło przy pierwszym rzucie. Obliczyć wartość oczekiwaną sumy wyrzuconych oczek (łącznie
z pierwszym rzutem).
3. (40. OM, finał): Niech n, k będą dodatnimi liczbami całkowitymi. Tworzymy ciąg zbiorów
A0 , A1 , . . . , Ak przyjmując, że A0 = {1, 2, . . . , n}, a dla i = 1, 2, . . . , k zbiór Ak jest losowo
wybranym podzbiorem Ai−1 , przy czym wybór każdego podzbioru jest jednakowo prawdopodobny.
Rozpatrujemy zmienną losową równą liczbie elementów zbioru Ak . Dowieść, że jej wartość
oczekiwana jest równa n2−k .
4. Karty z napisanymi na nich liczbami od 1 do n tasujemy, a następnie rozkładamy je
na stosy. Pierwsza karta stanowi początek pierwszego stosu. Dla i ­ 2 jeśli liczba na i-tej
karcie jest większa niż liczba na i − 1-wszej, to i-tą kartę kładziemy na ten sam stos, co i − 1wszą, w przeciwnym zaś wypadku i-ta karta stanowi początek kolejnego stosu. Obliczyć wartość
oczekiwaną liczby stosów.
5. (zmodyfikowane zadanie z OM): Wypisujemy kolejno wyrazy ciągu (n1 , n2 , . . . , nk ), gdzie
n1 = 1000, zaś nj dla j > 1 jest liczbą całkowitą wybraną losowo z przedziału [0, nj−1 −1] (wybór
każdej liczby z tego przedziału jest jednakowo prawdopodobny). Kończymy wypisywanie, gdy
wybrana liczba jest zerem, tzn. nk−1 6= 0, nk = 0. Długość k ciągu (n1 , n2 , . . . , nk ) jest zmienną
1
losową. Udowodnić, że jej wartość oczekiwana jest równa 1 + 21 + . . . + 1000
.
6. Ze zbioru {1, 2, . . . , n} wybieramy losowo bez zwracania k liczb (k ¬ n). Oblicz wartość
oczekiwaną różnicy między największą a najmniejszą z wylosowanych liczb.
Download