Prognozowanie (finanse 2011) dr Grzegorz Szafrański pokój B106 Termin konsultacji piątki: parzysty 8.10-9.40, nieparzysty 13.15-14.45 Prognozowanie strukturalne Wykorzystanie faktu korelacji zmiennych: • przyczynowej (związek przyczynowo-skutkowy a jego stabilność), • symptomatycznej (ukryty mechanizm, wspólne przyczyny różnych zjawisk i przybliżenie ich działania przez związaną z nimi zmienną tzw. aproksymantę jak np. przyczyny jednokierunkowo oddziałujące na zmienną w czasie – trend, wykazujące dostosowania do poziomu równowagi – modele AR, cykle – analiza spektralna), • przypadkowej – bezzasadne. Budowa modelu • Sformułuj problem ekonomiczny • Zilustruj go danymi empirycznymi • Podaj jego teoretyczne rozwiązanie (hipotezy, model ekonomiczny) • Dobierz zmienne objaśniające • Sprawdź teorię za pomocą modelu ekonometrycznego Dwie typowe sytuacje Dobrze określona w literaturze teoria ekonomiczna i model Liczne badania potwierdzają teorię Problemy doboru zmiennych, wykorzystania dostępnych danych i krytycznego spojrzenia na wyniki Problem słabo rozpoznany na gruncie teoretycznym Brak potwierdzenia teorii lub nieliczne badania Problemy poprawnego opisu mechanizmu za pomocą podstawowych praw ekonomii Weryfikacja modelu • Budowa postaci modelu (liniowy, potęgowy, inny nieliniowy?) • Estymacja modelu (wybór metody, MNK, MNW czy inna?) • Weryfikacja ekonomiczna (czy zgodny z teorią?) • Weryfikacja statystyczna (na ile zgodny z teorią?) • Propozycje poprawy i wykorzystania modelu Problem ekonomiczny Krótki opis problemu: Im większa produkcja tym wyższe koszty, ale rosną one coraz wolniej. Dlaczego? Odpowiedzi szukamy w teorii ekonomicznej: W produkcji występują koszty stałe (nie zależą od wielkości produkcji) i zmienne (zależne). • Jak je wydzielić, gdy mamy dane: Y – koszt całkowity, w mln zł X – ilość produktów, w tys. szt. Model ekonomiczny • Formułujemy hipotezę ekonomiczną w postaci „Y zależy od X”: Y = f(X) • Zależność ta może mieć postać liniową Y= 0 + 1X i 0>0, 1>0 0, 1 to parametry modelu – Czy istnieje empiryczna zależność między X a Y? – Czy jest ona zgodna z hipotezą (np. czy 1>0)? Model ekonometryczny • Przedstawiamy teorię ekonomiczną z dokładnością do zmiennej losowej et i badamy, czy zachodziła w pewnym okresie czasu: t = 1,...,T • Sprawdzamy zależność stochastyczną: yt= 0 + 1xt + et E(et) = 0, xt nielosowe, stąd E(yt) = 0+ 1xt D2(et) = E(et2)= s2, E(etet-i) = 0 Zwykle przyjmuje się również postać rozkładu zmiennej et ~ N(0, s2) Metoda najmniejszych kwadratów • Estymacja – szacowanie nieznanych parametrów modelu na podstawie próby wg określonego kryterium • Funkcja regresji II rodzaju – wartość teoretyczna: • pt = b0 + b1xt • To co zostaje to reszta: et = yt – (b0 + b1xt) • Kryterium MNK: minimalizacja sumy kwadratów reszt SSQ dla różnych wartości ocen parametrów a0, a1 • SSQ(b0, b1) = St et2 minimalizuj Metoda regresji • Próbujemy poznać nieznane parametry modelu yt= 0 + 1xt + et • Poprzez estymację: yt = b0 + b1xt + et • Estymator to przepis na b0 i b1 np. dla MNK taki: • b1 =St [(xt - xśrednie) (yt - yśrednie)]/St (xt - xśrednie)2 • b0 = yśrednie - b1 xśrednie Zadanie • Dokonaj estymacji modelu: yt = β0 + β1 xt + εt y – koszty w mln złotych, x – ilość w tys. sztuk • Problemy dostępności danych • Dane w pliku jedna_zmienna.xls Konwencja • Model zwykle zapisujemy: próba: 2001.001 – 2002.008 yˆ t = 83.87 + 0.08 xt t - stat (2.56) (5.23) Model popytu (liniowy) • Popyt na bilety do kina (Przykład 1 Wydatki Okres Stycze ń Luty • Funkcja popytu – paliwa (przykład 3 Maddala r. 4) Cena biletu Liczba wizyt QP P Q = QP/P 150 PLN 152 PLN 30 PLN 38 PLN 5 4 qb,t yt pb = f( , , qp,t ), pt pt MNK wiele zmiennych • Model dla wielu zmiennych: y t = 0 + 1 x 1t + 2 x 2 t + ... + k x kt + e t • Zapis macierzowy (przykład – macierze): , xk1 e 1 y1 x11 x21 1 1 y x x 2 12 22 xk 2 e 2 . = 0 . + 1 . + 2 . + ... + k . + . . . . . . . x e . y x x 1 T 1T 2T kT T y = Xβ + ε 1 x11 1 x12 X= : : 1 x1T x 21 ... x k1 x 22 ... x k 2 : : x 2T x kT MNK wiele zmiennych cd • Po estymacji otrzymujemy: yˆ t = ˆ0 + ˆ1 x1t + ˆ2 x2t + ... + ˆk xkt • estymator wektora : ) ˆβ = XT X -1 XT y yˆ = Xβˆ y = Xβˆ + e Uzyskujemy go przez minimalizację wyrażenia: dQ / dβ = -2XT y + 2XT Xβ = 0 ) Q = e e = y - Xβ ) y - Xβ ) T T e1 e 2 e = : . e T Warunki stosowalności • Równanie liniowe względem parametrów i zakłóceń np.: y = + x + x 2 + e t 0 1 1t 2 1t t • T > K (na ogół dużo większe) • Kolumny X liniowo niezależne (wtedy XTX jest macierzą nieosobliwą) Założenia estymatora KMNK 1. E(et) =0 2. macierz wariancji-kowariancji D2(et)= s2I s 2 0 E ε Tε = s 2I = 0 ) 0 s2 0 0 .... 0 0 .... 0 ..... 2 0 .....s 3. Zmienne X są nielosowe (w powtarzanych próbach przyjmują ustalone wartości) Zwykle przyjmuje się również postać rozkładu zmiennej et ~ N(0, s2I) Własności estymatora KMNK Estymator KMNK jest zmienną losową, gdyż jest funkcją zmiennych losowych Jeżeli spełnione są założeniań klasycznej MNK to: Set = 0 i prognozy są nieobciążone E(bi) = βi i estymator jest nieobciążony Wariancja estymatora D2(bi) jest najmniejsza (z liniowych estymatorów), metoda MNK jest efektywna Ponadto estymator jest zgodny, (potocznie) im dłuższa próba tym trafniejsza ocena estymatora. MNK – prognoza Prognozę wyznaczamy na podstawie: yˆt = ˆ0 + ˆ1 xˆ1t + ˆ2 xˆ2t + ... + ˆk xˆkt Czyli oprócz K=k+1 ocen parametrów potrzebujemy K prognoz zmiennych objaśniających. Mówimy, że prognozy strukturalne są warunkowe ze względu na zmienne objaśniające Składnik resztowy przyjmujemy zgodnie z zasadą prognozy nieobiążonej jako równy 0, bo: E(et)=0 Zapis macierzowy: ˆ βˆ yˆ = X