Mikroekonometria 6 Mikołaj Czajkowski Wiktor Budziński Metody symulacyjne – Monte Carlo Metoda Monte-Carlo Wykorzystanie mocy obliczeniowej komputerów, aby poznać charakterystyki zmiennych losowych poprzez wielokrotne próbkowanie (zamiast rozwiązań analitycznych) Jak w kasynie – wielokrotnie gramy i obserwujemy nasze wyniki, żeby ocenić np. jaka jest wartość oczekiwana jakiegoś zagrania Np. w celu szacowania wartości skomplikowanych całek czaj.org Całkowanie przy pomocy metody Monte Carlo Załóżmy, że chcemy policzyć całkę a ∫ f ( y ) dy b Jeżeli potrafimy zapisać f ( y ) = h ( y ) g ( y ) , gdzie g ( y ) to gęstość znanego ciągłego rozkładu, to możemy ją przybliżyć jako: a ∫ b f ( y ) dy ≈ 1 R r h y ( ) ∑ r =1 R r y Gdzie jest wylosowane z rozkładu o gęstości g ( y ) czaj.org Całkowanie przy pomocy metody Monte Carlo czaj.org Zadanie 1. Całkowanie przy pomocy metody Monte Carlo Oszacuj używając metody Monte Carlo: 1. ∞ 1. ∫ exp ( − exp ( y ) ) −∞ 1 2. ∫ 0 1 exp ( − y 2 2 ) dy 2π 1 exp ( − y 2 2 ) dy 2π czaj.org Metody symulacyjne – symulowane dane Wykorzystanie symulowanych danych Zakładamy istnienie jakiegoś procesu generującego dane (DGP, data generating process) Takie dane pozwalają testować m.in.: Czy model ekonometryczny działa prawidłowo? Może programista się pomylił? Konsekwencje odstępstw od przyjętych założeń (np. dla KMRL) Zachowanie modelu dla małych prób Zaletą jest to, że dokładnie wiemy, jaki jest DGP Odpowiedź na powyższe pytania nie zawsze jest możliwa przy pomocy narzędzi analitycznych Proces może być zaimplementowany jako symulacja Monte Carlo, aby obserwować wariancję oszacowań czaj.org Testowanie działania modeli ekonometrycznych 1. 2. Algorytm symulacji Monte Carlo może wyglądać w następujący sposób Określ DGP (specyfikację, wartości parametrów) Wygeneruj wartości zmiennych objaśniających i błędy losowe Wykorzystaj odpowiednie rozkłady Wygeneruj wartości zmiennej objaśnianej Dokonaj estymacji modeli Zapisz wyniki Powtórz punkty 2-5 dużą liczbę razy Przeprowadź analizę zapisanych wyników 3. 4. 5. 6. 7. Wartość oczekiwana, wariancja czaj.org Zadanie 2. Analiza modeli ekonometrycznych 1. 2. 3. 4. 5. Sprawdź czy regresja liniowa jest prawidłowo zaprogramowana w Stacie Sprawdź jakie są konsekwencje pominięcia kwadratowej zależności w modelu regresji liniowej Sprawdź czy zależność „schodkowa” może zostać przybliżona zależnością kwadratową? (Problem analizowany na zajęciach 4.) Sprawdź czy endogeniczność obciąża oszacowania regresji liniowej Sprawdź czy model 2MNK rozwiązuje problem endogeniczności czaj.org Bootstrap Bootstrap to metoda symulacyjna, wykorzystująca podpróby posiadanej próby, zamiast wielu prób z populacji Może być wykorzystywana np. do wnioskowania statystycznego – kiedy nie znamy teoretycznych właściwości danej statystyki/estymatora Jeśli mielibyśmy 1000 prób z pewnej populacji, to dla każdej z nich moglibyśmy policzyć daną statystykę i w efekcie otrzymać jej 1000 oszacowań Średnią z tych 1000 oszacowań moglibyśmy traktować jako jej najlepsze oszacowanie, a wariancję jako miarę niepewności Wykorzystując te charakterystyki moglibyśmy przeprowadzić wnioskowanie statystyczne czaj.org Bootstrap Z próby wielkości N losujemy ze zwracaniem B „sztucznych” prób również o długości N. Przykładowo, mamy próbę 5 obserwacji: X 1 , X 2 , X 3 , X 4 , X 5 „Sztuczne” próby wyglądałyby np. tak: X1, X1, X 3 , X 4 , X 4 Albo X1, X 2 , X 3 , X 3 , X 3 Dla każdej z wylosowanych prób „sztucznych” obliczamy wartość interesującej nas statystyki/estymatora Wnioskowanie statystyczne przeprowadzamy analizując rozkład B oszacowań tej statystyki/estymatora. czaj.org Zadanie 3. Bootstrap i Jackknife Jackknife 1. 2. Podobna (wcześniejsza) metoda, polegająca na doborze obserwacji opierającym się na pominięciu (jednej lub więcej) obserwacji z próby Np. przeprowadzamy regresję n razy, za każdym razem pomijając kolejną z n obserwacji Wygeneruj sztuczne dane dla regresji z heteroskedastycznością Porównaj błędy standardowe z KMRL, macierzy White’a, bootstrapu oraz jackknife czaj.org Praca domowa ME.6 1. Wykorzystując metodę Monte Carlo: 1. 2. Zbadaj związek między heteroskedastycznością a regresją kwantylową – czy w przypadku homoskedastyczności parametry różnią się między kwantylami? Czy odpowiedź zmienia się w przypadku heteroskedastyczności? Zbadaj skutki występowania innego rozkładu błędu losowego niż normalny (w DGP wykorzystaj inny rozkład, np. lognormalny, jednostajny, Poissona, trójkątny). Czy powoduje to obciążenie oszacowań? Czy rozkład oszacowań jest normalny? Jakie są wyniki testów poprawności specyfikacji? Do przygotowania w grupach dwuosobowych czaj.org 20.06.2017 11:00:45