Prognozowanie i symulacja - Grzegorz Szafrański Homepage

advertisement
Prognozowanie (finanse 2011)
dr Grzegorz Szafrański
pokój B106
Termin konsultacji
piątki:
parzysty 8.10-9.40,
nieparzysty 13.15-14.45
Prognozowanie strukturalne
Wykorzystanie faktu korelacji zmiennych:
• przyczynowej (związek przyczynowo-skutkowy a jego
stabilność),
• symptomatycznej (ukryty mechanizm, wspólne przyczyny
różnych zjawisk i przybliżenie ich działania przez
związaną z nimi zmienną tzw. aproksymantę jak np.
przyczyny jednokierunkowo oddziałujące na zmienną
w czasie – trend, wykazujące dostosowania do poziomu
równowagi – modele AR, cykle – analiza spektralna),
• przypadkowej – bezzasadne.
Budowa modelu
• Sformułuj problem ekonomiczny
• Zilustruj go danymi empirycznymi
• Podaj jego teoretyczne rozwiązanie (hipotezy, model
ekonomiczny)
• Dobierz zmienne objaśniające
• Sprawdź teorię za pomocą modelu ekonometrycznego
Dwie typowe sytuacje
Dobrze określona w literaturze
teoria ekonomiczna i model
Liczne badania potwierdzają
teorię
Problemy doboru zmiennych,
wykorzystania dostępnych
danych i krytycznego
spojrzenia na wyniki
Problem słabo rozpoznany
na gruncie teoretycznym
Brak potwierdzenia teorii
lub nieliczne badania
Problemy poprawnego
opisu mechanizmu za
pomocą podstawowych
praw ekonomii
Weryfikacja modelu
• Budowa postaci modelu
(liniowy, potęgowy, inny nieliniowy?)
• Estymacja modelu
(wybór metody, MNK, MNW czy inna?)
• Weryfikacja ekonomiczna
(czy zgodny z teorią?)
• Weryfikacja statystyczna
(na ile zgodny z teorią?)
• Propozycje poprawy i wykorzystania modelu
Problem ekonomiczny
Krótki opis problemu: Im większa produkcja tym wyższe
koszty, ale rosną one coraz wolniej.
Dlaczego?
Odpowiedzi szukamy w teorii ekonomicznej:
W produkcji występują koszty stałe (nie zależą od
wielkości produkcji) i zmienne (zależne).
• Jak je wydzielić, gdy mamy dane:
Y – koszt całkowity, w mln zł
X – ilość produktów, w tys. szt.
Model ekonomiczny
• Formułujemy hipotezę ekonomiczną w postaci
„Y zależy od X”:
Y = f(X)
• Zależność ta może mieć postać liniową
Y= 0 + 1X
i
0>0, 1>0
0, 1 to parametry modelu
– Czy istnieje empiryczna zależność między X a Y?
– Czy jest ona zgodna z hipotezą (np. czy 1>0)?
Model ekonometryczny
• Przedstawiamy teorię ekonomiczną z dokładnością do
zmiennej losowej et i badamy, czy zachodziła w pewnym
okresie czasu: t = 1,...,T
• Sprawdzamy zależność stochastyczną:
yt= 0 + 1xt + et
E(et) = 0,
xt nielosowe, stąd E(yt) = 0+ 1xt
D2(et) = E(et2)= s2, E(etet-i) = 0
Zwykle przyjmuje się również postać rozkładu zmiennej et ~ N(0, s2)
Metoda najmniejszych kwadratów
• Estymacja – szacowanie nieznanych parametrów modelu
na podstawie próby wg określonego kryterium
• Funkcja regresji II rodzaju – wartość teoretyczna:
• pt = b0 + b1xt
• To co zostaje to reszta: et = yt – (b0 + b1xt)
• Kryterium MNK: minimalizacja sumy kwadratów reszt
SSQ dla różnych wartości ocen parametrów a0, a1
• SSQ(b0, b1) = St et2
minimalizuj
Metoda regresji
• Próbujemy poznać nieznane parametry modelu
yt= 0 + 1xt + et
• Poprzez estymację:
yt = b0 + b1xt + et
• Estymator to przepis na b0 i b1 np. dla MNK taki:
• b1 =St [(xt - xśrednie) (yt - yśrednie)]/St (xt - xśrednie)2
• b0 = yśrednie - b1 xśrednie
Zadanie
• Dokonaj estymacji modelu:
yt = β0 + β1 xt + εt
y – koszty w mln złotych,
x – ilość w tys. sztuk
• Problemy dostępności danych
• Dane w pliku jedna_zmienna.xls
Konwencja
• Model zwykle zapisujemy:
próba: 2001.001 – 2002.008
yˆ t
=
83.87 + 0.08 xt
t - stat (2.56) (5.23)
Model popytu (liniowy)
• Popyt na bilety do kina
(Przykład 1
Wydatki
Okres
Stycze
ń
Luty
• Funkcja popytu – paliwa
(przykład 3 Maddala r. 4)
Cena
biletu
Liczba
wizyt
QP
P
Q = QP/P
150 PLN
152 PLN
30 PLN
38 PLN
5
4
qb,t
yt pb
= f( ,
, qp,t ),
pt pt
MNK wiele zmiennych
• Model dla wielu zmiennych:
y t =  0 + 1 x 1t +  2 x 2 t + ... +  k x kt + e t
• Zapis macierzowy (przykład – macierze):
,
 xk1  e 1 
 y1 
 x11 
 x21 
1
   
 
 
 
1
y
x
x
2
12
22
 xk 2  e 2 
 
 
 

.  =  0 .  + 1 .  +  2 .  + ... +  k .  + . 
   
 
 
 

.
.
.
.
.  . 
 
 
 

 x  e 
. y 
x 
x 
1

 T
 1T 
 2T 
 kT   T 
y = Xβ + ε
1 x11

1 x12

X=
: :

1 x1T
x 21 ... x k1 

x 22 ... x k 2 
:
: 

x 2T x kT 
MNK wiele zmiennych cd
• Po estymacji otrzymujemy:
yˆ t = ˆ0 + ˆ1 x1t + ˆ2 x2t + ... + ˆk xkt
• estymator wektora :

)
ˆβ = XT X -1 XT y
yˆ = Xβˆ
y = Xβˆ + e
Uzyskujemy go przez minimalizację wyrażenia:
dQ / dβ = -2XT y + 2XT Xβ = 0
 )
Q = e e = y - Xβ ) y - Xβ )
T
T
e1 
e 
 2
e = : 
 
. 
e 
 T
Warunki stosowalności
• Równanie liniowe względem parametrów i
zakłóceń np.: y =  +  x +  x 2 + e
t
0
1 1t
2 1t
t
• T > K (na ogół dużo większe)
• Kolumny X liniowo niezależne (wtedy XTX
jest macierzą nieosobliwą)
Założenia estymatora KMNK
1. E(et) =0
2. macierz wariancji-kowariancji D2(et)= s2I
s 2

0
E ε Tε = s 2I = 


0
 )
0
s2

0
0 .... 0 

0 .... 0 
 .....  

2
0 .....s 
3. Zmienne X są nielosowe (w powtarzanych próbach
przyjmują ustalone wartości)
Zwykle przyjmuje się również postać rozkładu zmiennej et ~
N(0, s2I)
Własności estymatora KMNK
Estymator KMNK jest zmienną losową, gdyż jest funkcją zmiennych
losowych
Jeżeli spełnione są założeniań klasycznej MNK to:
Set = 0
i prognozy są nieobciążone
E(bi) = βi
i estymator jest nieobciążony
Wariancja estymatora D2(bi) jest najmniejsza (z liniowych estymatorów),
metoda MNK jest efektywna
Ponadto estymator jest zgodny, (potocznie) im dłuższa próba tym
trafniejsza ocena estymatora.
MNK – prognoza
Prognozę wyznaczamy na podstawie:
yˆt = ˆ0 + ˆ1 xˆ1t + ˆ2 xˆ2t + ... + ˆk xˆkt
Czyli oprócz K=k+1 ocen parametrów potrzebujemy K
prognoz zmiennych objaśniających.
Mówimy, że prognozy strukturalne są warunkowe ze względu
na zmienne objaśniające
Składnik resztowy przyjmujemy zgodnie z zasadą prognozy
nieobiążonej jako równy 0, bo: E(et)=0
Zapis macierzowy:
ˆ βˆ
yˆ = X
Download