Aby oszacować liniowy model ekonometryczny należy

advertisement
Wykłady z Ekonometrii
1
dr Ewa Kusideł
Wstęp
Pomimo, że poniższe materiały mają za zadanie w jak największym stopniu ułatwić
naukę ekonometrii, nie obejdzie się bez wprowadzenia formalnych określeń i definicji.
Dlaczego? Otóż wbrew pozorom służy to ułatwieniu, a nie komplikowaniu wykładu. Czy
wyobrażacie sobie na przykład lekarza, który w czasie operacji mówi do instrumentariuszki:
podaj mi ów mały nóż o ostrzu jednostronnym lub na końcu dwustronnym 1? Zanim
pielęgniarka zorientuje się, że chodzi o skalpel, pacjent może umrzeć. A co z prawnikiem,
który mówi do kolegi idąc do sądu, że idzie do państwowego organu wymiaru
sprawiedliwości2 myśląc o sądzie. Albo meteorologa, który mówi, że wzrośnie wielkość
fizyczna równa stosunkowi siły działającej prostopadle na daną powierzchnię – do wielkości
tej powierzchni3 zamiast powiedzieć, że wzrośnie ciśnienie. A możecie sobie wyobrazić
definicję użytych powyżej słów: instrumentariuszka, prawnik, meteorolog?. Zajrzyjcie do
słownika, i nie zdziwcie się, gdy wyjaśnienie będzie nie miej zrozumiałe niż samo słowo, jak
w przypadku ciśnienia (bo o to chodziło w tym stosunku powierzchni).
Każda dziedzina wytwarza swój specyficzny język; inżynierowie, prawnicy, lekarze,
ekonomiści mają swój własny kod porozumiewania. Dlaczego?. Żeby było krócej i
precyzyjniej. Czasami brak tej precyzji może tylko śmieszyć, jak w przypadku meteorologa,
lecz czasem może mieć wagę ludzkiego życia, jak w przypadku niedouczonego lekarza.
W ekonometrii nie podejmujemy na szczęście decyzji na taką miarę, lecz
posługiwanie się pewnymi określeniami po prostu ułatwia sprawę. Początkowo te określenia
takie jak składnik losowy, zmienna endogeniczna itd. będą dla nas trudne, ale to tylko dlatego,
że są nowe. Czy trzeba wam teraz dokładnie wyjaśniać pojęcia takie jak substytut, dobro
komplementarne, czy popyt? Nie, a przecież są to bardzo specjalistyczne nazwy. To że nie
trzeba ich wyjaśniać wynika z „obycia” się z nimi, podobnie jak będzie po pewnym czasie z
ekonometrią. A zatem kontynuujemy formalny wykład, na razie nie przejmując się za bardzo
tymi formalnymi określeniami.
Definicja przytoczona za Słownikiem języka polskiego, [1981], PWN, Warszawa, tom III, s.223
tamże, s 183
3
tamże, tom I, s 309
1
2
1
Wykłady z Ekonometrii
2
dr Ewa Kusideł
1. Informacje początkowe
1.1 Definicje ekonometrii
Chow (1995):
„Ekonometria jest nauką i sztuką stosowania metod statystycznych do
mierzenia relacji ekonomicznych”.
Pawłowski (1978): „Ekonometria jest nauką o metodach badania ilościowych prawidłowości
występujących w zjawiskach ekonomicznych za pomocą odpowiednio wyspecjalizowanego
aparatu matematyczno-statystycznego”.
Maddala (2001):
Ekonometria to zastosowanie metod statystycznych i matematycznych do
analizy danych ekonomicznych w celu nadania teoriom ekonomicznym kontekstu
empirycznego oraz ich potwierdzenia lub odrzucenia”.
Ostateczna (nasza) definicja: „Ekonometria jest obszarem ekonomii zajmującym się
zastosowaniem narzędzi statystycznych i matematycznych do empirycznego mierzenia i
weryfikacji teorii postulowanych przez teorię ekonomii”.
1.2. Dziedziny pokrewne Ekonometrii
Ekonomia matematyczna - zajmuje się matematycznym zapisem teorii ekonomicznych oraz
tworzeniem modeli ekonomicznych, na podstawie których wyprowadzane są twierdzenia
ekonomiczne.
Ekonomia matematyczna nie zajmuje się empiryczną weryfikacją swoich
twierdzeń - formułuje tylko pewne hipotezy dotyczące funkcji opisującej powiązania między
badanymi zmiennymi ekonomicznymi.
Badania operacyjne – to szereg metod wykorzystywanych do podejmowania decyzji
optymalnych z punktu widzenia określonego celu, przy uwzględnieniu dających się
zdefiniować ograniczeń technicznych, ekonomicznych.
1.3. Warunki stosowania ekonometrii:

Znajomość teorii ekonomicznych.
Jakie teorie ekonomiczne mogą być testowane w ramach ekonometrii?. Przykłady:

Popytu – prawo popytu,
Stopy procentowe – teoria podaży pieniądza,
Inflacja – krzywa Phillipsa,
Dochód - krzywe Engela,
Produkcja –funkcja Cobb-Douglasa.
Uwzględniane zjawiska ekonomiczne i pozaekonomiczne muszą być mierzalne lub
sprowadzalne do mierzalnej postaci.

Dostępne są dane statystyczne dotyczące badanych czynników, które posłużą do
budowy zmiennych modelu.
2
Wykłady z Ekonometrii
dr Ewa Kusideł
3
1.4. Rodzaje danych statystycznych
1. Szeregi czasowe (time series data TSD): xt for t=1,2,…,T.
Przykład szeregu czasowego:
Liczba zatrudnionych w Polsce w okresie 1. kwartał 1995 – 4. kwartał 2006
9500
9000
8500
8000
7500
7000
1 2 3 4 1 2 3 4 1 2 3 4 1 2 3 4 1 2 3 4 1 2 3 4 1 2 3 4 1 2 3 4 1 2 3 4 1 2 3 4 1 2 3 4 1 2 3 4
1995
1996
1997
1998
1999
2000
2001
2002
2003
2004
2005
2006
2. Dane przekrojowe lub przestrzenne4 (cross-section or spatial data CSD): xi
for
i=1,2,…,N.
Przykład danych przekrojowych (przestrzennych):
Liczba zatrudnionych w 4. kwartale 2006 w 16 województwach Polski
ku
do
ja
w l no
sk
ś
o- l ąs
po
k
m ie
or
sk
ie
lu
be
ls
ki
e
lu
bu
sk
i
łó e
m dzk
ał
i
e
o
m pol
az
sk
ow ie
ie
ck
o ie
po pol
dk sk
ar ie
pa
c
po kie
dl
as
po ki
m e
or
sk
ie
ś
w
ar wi ę ślą
s
t
m
iń okr ki e
z
sk
o- ysk
m
i
az e
za
ur
w
s
i
ch
e
ki
od lko
e
p
ni
o- ols
po ki
m e
or
sk
ie
2500
2000
1500
1000
500
0
3. Dane panelowe lub przestrzenno-czasowe (panel data or cross-section time PD): xit for
i=1,2,…,N; t=1,2,…,T.
Przykład danych panelowych: Liczba zatrudnionych w 6 województwach Polski mierzona w
4 kolejnych kwartałach 2006 r
2209
1151
1116
1064
1068
741
880
741
929
725
929
702
920
1161
1305
1146
1378
2158
441
4Q2006
2133
442
1111
3Q2006
1348
2076
404
1096
1195
2Q2006
390
1Q2006
dolnośląskie
kujawsko-
lubelskie
lubuskie
łódzkie
małopolskie mazowieckie
pomorskie
.
W istocie pojęcie dane przekrojowe jest nieco szersze niż dane przestrzenne, bowiem uwzględnia fakt, że
analizowane dane pochodzą nie tylko z poszczególnych punktów przestrzeni (jak w podanym przykładzie), ale
mogą oznaczać dowolny obiekt, jak np. grupę gospodarstw domowych, lub grupę przedsiębiorstw.
4
3
Wykłady z Ekonometrii
4
dr Ewa Kusideł
2. Mierzenie zależności pomiędzy zjawiskami ekonomicznymi za pomocą korelacji
Wygodnym sposobem opisu siły i kierunku wpływu jednej zmiennej na drugą jest
współczynnik korelacji.
Dodatnia korelacja (dokładnie dodatni współczynnik korelacji) oznacza, że wzrostowi
(spadkowi) wartości pierwszej cechy np. X towarzyszy wzrost (spadek) wartości drugiej
cechy Y. W przyrodzie, życiu i gospodarce znajdujemy szereg przykładów na dodatnią
korelację, np. pomiędzy:
-
ilością spożywanego jedzenia (X) i wagą ciała (Y) – choć niektórych chudzielców to nie
dotyczy;
-
ilością wypalanych papierosów (X) i prawdopodobieństwem zachorowania na raka płuc
(Y), lub choroby układu krążenia (Y);
-
wilgotnością powietrza (X) i ilością komarów w lecie (Y);
-
żyznością gleby (X) i wzrostem roślin (Y);
-
dochodem (X) i popytem na dobra wyższego rzędu (Y);
-
reklamą (X) i popytem (Y).
Gdy zależność pomiędzy dwoma cechami jest odwrotnie proporcjonalna mówimy, że są one
ujemnie skorelowane. Ujemna korelacja (dokładnie ujemny współczynnik korelacji)
oznacza, że wzrostowi (spadkowi) wartości pierwszej cechy (X) towarzyszy spadek (wzrost)
wartości drugiej cechy (Y). Ujemną korelację możemy zaobserwować na przykład pomiędzy:
-
ilością spożywanego jedzenia (X) i sprawnością fizyczną (Y);
-
ilością wypalanych papierosów (X) i długością życia (Y);
-
wilgotnością powietrza (X) i ilością wypijanych napojów (Y);
-
żyznością gleby (X) i nieurodzajem (Y);
-
dochodem (X) i popytem na dobra niższego rzędu
-
reklamą dobra (X) i popytem na dobro konkurencyjne (Y);
-
cena dobra (X) i popyt na to dobro (Y)5.
Możemy również mówić o braku korelacji, czy inaczej mówiąc o korelacji zerowej6, która
oznacza, że wzrost (spadek) wartości cechy X nie towarzyszą zmiany wartości cechy Y.
Korelacją zerową, czyli brakiem korelacji charakteryzuje się większość przypadkowo
dobranych zjawisk. Brak korelacji, czyli zależności występuje na przykład pomiędzy:
-
ilością spożywanego jedzenia (X) i ilością komarów w lecie (Y);
Od tej reguły są pewne wyjątki o których piszemy przy okazji korelacji C a - Pa
W praktyce nie otrzymujemy współczynników korelacji, które są dokładnie równe 0. O braku korelacji
mówimy więc, gdy współczynnik korelacji można ocenić jako nieistotny statystycznie, o czym będzie szerzej
mowa w paragrafie poświęconym badaniu istotności zmiennych i parametrów.
5
6
4
Wykłady z Ekonometrii
dr Ewa Kusideł
5
-
ilością wypalanych papierosów (X) i wilgotnością powietrza (Y);
-
żyznością gleby (X) i ilością wypalanych papierosów;
-
dochodem (X) i popytem na dobra pierwszej potrzeby (Y)7.
2.1. Korelogramy (scatter diagram)
Graficzną interpretacją siły i kierunku związku pomiędzy zmiennymi jest wykres zależności
tych zmiennych. Taki wykres nazywamy korelogramem, lub wykresem skaterowym (ang.
scatter diagram).
Przykład: cena i popyt na produkt A (dane do przykładu znajdują się w pliku example1.xls)
cena
2,40
2,30
popyt
136
151
2,20
2,20
2,10
2,00
1,90
1,80
1,70
157
157
185
199
235
246
271
1,60
294
Korelogram: wykres zależności pomiędzy ceną i popytem na produkt A
demand (sale)
300
250
200
150
100
1,50
1,70
1,90
2,10
2,30
2,50
price
7
W tym przypadku mielibyśmy do czynienia ze słabą korelacją.
5
Wykłady z Ekonometrii
6
dr Ewa Kusideł
Co nam mówi korelogram (o zależnościach liniowych):
1. Mówi nam o kierunku zależności.
a. Rosnąca linia: dodatnia korelacja.
b. Malejąca linia: ujemna korelacja.
2. Mówi nam o sile zależności.
a. Im bardziej prostą linię formują punkty korelogramu tym silniejsza zależność.
b. Im bardziej „okrągły” kształt formują punkty korelogramu, tym słabsza zależność.
c. Prosta linia, lecz równoległa do którejkolwiek osi oznacza brak korelacji.
2.2. Definicja współczynnika koralacji
Formuła na wyliczenie współcznynnika korelacji pomiędzy dwiema zmiennymi jest
następująca:
rxy 
cov( x, y )

sx sy
1 n
 ( xi  x )( y i  y )
n i 1
1 n
( xi  x ) 2

n i 1
1 n
( yi  y) 2

n i 1
2.3. Właściwości współczynnika korelacji
1. rxy jest miarą z przedziału (-1;1).
2. Moduł z rxy oznacza siłę związku.
3. Znak rxy oznacza kierunek powiązań pomiędzy x i y.
Znak współczynnika korelacji (kierunek powiązań pomiędzy x i y)

rxy <0 – ujemna korelacja: jeśli x rośnie (spada), to y spada (rośnie).

rxy >0 – dodatnia korelacja: jeśli x rośnie (spada), to y rośnie (spada).
Siła korelacji
Moduł z rxy, którego wartość jest z przedział (0;1) informuje nas o sile związku pomiędzy
dwoma zmiennymi.

rxy = 0 - zmienne nie są powiązane, czyli nie są skorelowane.

rxy =1 – bardzo silna korelacja pomiędzy zmiennymi.
6
Wykłady z Ekonometrii
dr Ewa Kusideł
7
Przykład „ręcznego” obliczenia współczynnika korelacji
(przykład ten znajduje się w pliku correlation_for_demand_A.xls)
27
3. Model ekonometryczny
3.1. Definicje
Model ekonometryczny - jest podstawowym narzędziem w ekonometrii, służącym do analizy
zależności zachodzących między różnymi zjawiskami.
Model - jest uproszczonym odwzorowaniem rzeczywistości, uproszczoną reprezentacją
realnego obiektu, realnej sytuacji lub realnego procesu. Jego cechą charakterystyczną jest, że:
- uwzględnia tylko istotne cechy, najważniejsze z punktu widzenia określonego celu,
- nie jest dokładną reprezentacją rzeczywistości.
Pawłowski [1978]: „Model ekonometryczny jest to konstrukcja formalna, która za pomocą
jednego równania lub układu równań przedstawia zasadnicze powiązania występujące
pomiędzy rozpatrywanymi zjawiskami ekonomicznymi”.
7
Wykłady z Ekonometrii
8
dr Ewa Kusideł
3.2. Etapy budowy modelu ekonometrycznego
1. Sformułowanie hipotezy ekonomicznej: Y=f(X1,X2,…,Xk)
2. Zebranie danych
3. Ustalenie postaci analitycznej równania (równań)
4. Estymacja
5. Interpretacja i/lub prognozowanie (przed interpretacją modelu należy go poddać
weryfikacji statystycznej)
3.2.1. ETAP 1: Sformułowanie hipotezy ekonomicznej
Zależność pomiędzy interesującym nas zjawiskiem – y- a czynnikami go kształtującymi x1,
x2, x3 itd. możemy zapisać jako:
(3.2.1)
y=f(x1, x2, ..., xk,…)
Równanie (3.2.1) opisuje hipotezę ekonomiczną, która określa zjawisko ekonomiczne będące
przedmiotem naszego zainteresowania (np. popyt jak w przypadku case study w rozdziale 8) i
czynniki go kształtujące (w case study z rozdziału 8 są to: cena, dochody,...).
Powiązania pomiędzy zmiennymi x1, x2, ..., xk a zmienną y znajdują swój formalny
zapis w modelu ekonometrycznym, który jest równaniem (lub grupą równań) w którym rolę
zmiennej objaśnianej (zwanej też engogeniczną lub i) pełni interesujące nas zjawisko
ekonomiczne -y, a rolę zmiennych objaśniających (egzogenicznych, niezależnych)- czynniki
go kształtujące, czyli iksy. Dla takiego równania charakterystyczne są zatem: zmienna
objaśniana i objaśniające, postać analityczna związku który pomiędzy nimi zachodzi (funkcja
liniowa, potęgowa i.t.d.- por. 1.2), parametry strukturalne (współczynniki funkcji), które
mierzą siłę i kierunek wpływu poszczególnych zmiennych objaśniających na zmienną
objaśnianą.
Zwróćmy uwagę na trzykropek, który pojawił się w powyższym równaniu.
Zamknięcie nawiasu bez jego uwzględnienia oznaczałoby, że wymieniliśmy wszystkie
czynniki wpływające na na badane zjawisko y. Czy taka sytuacja jest możliwa?. Czy w
przypadku jakiegokolwiek zjawiska będziemy mogli stwierdzić, że wyróżniliśmy wszystkie
czynniki go kształtujące? Raczej nie, ze względu na czynniki nieprzewidywalne (pogoda,
wojna) lub takie, których wpływ jest mało istotny (na przykład reklama rękawiczek
skórzanych, pomocnych w prowadzeniu samochodu, może mieć wpływ na popyt na ten
samochód, lecz jest to wpływ mało istotny).Trzykropek reprezentuje wpływ zjawisk
nieuwglęnionych w modelu, który w modelach ekonometrycznych jest reprezentowany przez
składnik losowy.
8
Wykłady z Ekonometrii
9
dr Ewa Kusideł
3.2.2. ETAP 2: Zebranie danych
Dane statystyczne do modelu ekonometrycznego mogą pochodzić z wielorakich źródeł.
Poniżej wymieniono kilka z nich:
1. dane zbierane przez GUS (Główny Urząd Statystyczny, w Łodzi na ul. Suwalskiej)
powstające w wyniku ankietowania przedsiębiorców, zbierane w postaci miesięcznych lub
kwartalnych szeregów i publikowane w Biuletynach Statystycznych. Błędy
z tego
rodzaju danych pochodzą od pracodawców, którzy z różnych powodów zawyżają lub
zaniżają wartość różnych zmiennych (liczba i wynagrodzenie pracowników, obroty i zyski
firmy i.t.p). dane pochodzące z badania budżetu gospodarstw domowych, których
użyteczność jest ograniczona rzadkością przeprowadzonego badania (co kilka lat);
2. dane pochodzące z Urzędów Pracy;
3. dane z Badania Aktywności Ekonomicznej Ludności (mają postać szeregów kwartalnych i
uznaje się je za jedne z bardziej reprezentatywnych);
4. dane pochodzące z ankiet przeprowadzanych na zamówienie konkretnego klienta. Błąd w
tego rodzaju danych może wynikać z niereprezentatywnośći próby i nieprawdomówności
respondentów.
Bardzo często dzieje się tak, że zestaw zmiennych zaproponowanych w hipotezie
ekonomicznej jest znacznie zredukowany ze względu na brak danych statystycznych. Brak
ten może wynikać z faktu, że dane te nie istnieją, np. nie robiono wcześniej podobnych badań
i posiadać dane na ten temat należy przeprowadzić własne badania ankietowe. Może się
również zdarzyć, że dane istnieją, ale są dla badacza nie dostępne – jak w przypadku
informacji o dobrach substytucyjnych wytwarzanych przez konkurencyjną firmę.
3.2.3. ETAP 3: Ustalenie postaci analitycznej równania
Przypomnijmy, że równanie (3.2.1) opisuje zjawisko Y jako funkcję czynników go
określających. Nie wiadomo natomiast jaki rodzaj funkcji należy zastosować: liniową,
potęgową, wykładniczą i.t.d. Postać funkcyjna modelu powinna odzwierciedlać rzeczywiste
interakcje pomiędzy zmiennymi, tzn. jeżeli zależność jest liniowa należy użyć funkcji
liniowej, jeśli jest nieliniowa, należy użyć funkcji nieliniowej.
Zależności liniowe, to inaczej mówiąc zależności proporcjonalne, czyli takie, dla
których taka sama zmiana jednego czynnika powoduje taką samą zmianę drugiego. Mogą one
być wprost proporcjonalne, gdy wzrost (spadek) jednej zmiennej powoduje wzrost (spadek)
9
Wykłady z Ekonometrii
10
dr Ewa Kusideł
drugiej, oraz odwrotnie proporcjonalne, gdy wzrost (spadek) jednej zmiennej powoduje
spadek (wzrost) drugiej.
Można zastanowić się, czy typowe czynniki kształtujące popyt obrazują zależności
liniowe, czy nieliniowe. Czy możemy założyć, że podobne przyrosty dochodów i reklamy
będą powodować zawsze takie same przyrosty popytu. Gdyby tak było, to w przypadku
reklamy moglibyśmy mówić o superecepcie na sukces, bo oznaczałoby to, że ciągły wrost
wydatków na reklamę powoduje nieskończony przyrost popytu – a tak niestety nie jest. W
przypadku dochodu, proporcjonalny wzrost popytu na jakieś dobro i usługę w porównaniu do
wzrostu dochodu spowodowałoby, że bogaci ludzie byliby „zalani” potokiem dóbr, na które
popyt powinien nieprzerwanie wzrastać. Czy kupimy bowiem następną suszarkę, telewizor
tylko dlatego, że nas na to stać? Czy będziemy wychodzić codziennie do kina, fryzjera,
kosmetyczki, tylko dlatego, że rosnący dochód, zgodnie z relacją liniową, powinien się
przełożyć na proporcjonalny wzrost popytu na te usługi?
Odpowiedź na powyższe pytania jest negatywna: zarówno wpływ reklamy jak i
dochodu nie wpływa liniowo na popyt, lecz po osiągnięciu pewnego pułapu popyt stabilizuje
się na pewnym poziomie (jest to punkt nasycenia, stabilizacji wydatków, lub w przypadku
reklamy punkt nasycenia rynku)8. Matematycznie rzecz ujmując do opisania zależności
pomiędzy dochodem, reklamą i popytem powinniśmy użyć funkcji, która posiada asymptotę
poziomą, która będzie odzwierciedlała stabilizację popytu na pewnym poziomie9.
Funkcjami takimi są funkcje wymierne, które w przypadku, gdy opisują relacje
pomiędzy dochodami i wydatkami na określone grupy dóbr, opisywane w teorii Engle’a.
Szersze omówienie tej kwestii znajduje się w rozdziale 8 dotyczącym Modeli Törnquista.
W praktyce, na szczęście dla większości studentów, głównym zadaniem w przypadku
doboru postaci funkcyjnej modelu, jest stwierdzenie, czy dana zależność ma postać liniową
czy krzywoliniową10. W pierwszym wypadku używamy naturalnie funkcji liniowej, w
drugim zaś używamy najczęściej funkcji potęgowej, której pewne własności predysponują ją
do opisu nieliniowych zależności11.
Jeżeli możemy założyć, że poziom wydatków na dane dobre jest daleki od stabilizacji możemy zastosować
funkcję liniową. Szersze omówienie tej kwestii znajduje się w załączniku pt. Model Allena-Bowleya.
9
Nawiasem mówiąc, fakt, że wiele zjawisk ekonomicznych “układa się” w znane z matematyki wykresy funkcji,
jest fundamentem ekonometrii, bo skłonił naukowców do próby opisu tych zjawisk za pomocą tych funkcji.
10
Pełny zestaw nieliniowych funkcji trendu znajduje się w rozdziale 7.
11
Mowa tu o dogodnej interpretacji parametrów tej funkcji w kategoriach elastyczności. O ile jednak w
przypadku nieliniowych zależności przyczynowo-skutkowych najwygodniej jest używać funkcji potęgowej, to w
takim samym przypadku używamy funkcji wykładniczej dla modeli trendu.
8
10
Wykłady z Ekonometrii
11
dr Ewa Kusideł
Funkcja liniowa (jednorównaniowy model liniowy) ma postać:
(3.2.3a) y=0+1x1+2x2+...+k+
Funkcja potęgowa (jednorównaniowy model potęgowy) ma postać:
(3.2.3b) y=0 x11x22… xkke
gdzie:
0 – wyraz wolny równania,
1,...,k – parametry strukturalne,
 - składnik losowy.
W ten sposób – po odrzuceniu zmiennych na temat których nie udało się zebrać danych i po
ustaleniu postaci funkcyjnej - hipoteza ekonomiczna (3.2.1) zamienia się w model
ekonometryczny. Zwróćmy uwagę, że miejsce trzykropka zajął teraz tzw. składnik losowy.
Powody występowania składnika losowego  w równaniach ekonometrycznych można
wyjaśnić następującymi przyczynami:
1. Nieuwzględnieniu wszystkich zmiennych. Należy tu rozróżnić jednakże różne przyczyny
nieuwzględniania zmiennych:
a) z powodu braku danych statystycznych na temat badanej zmiennej (np. w badaniach
rynkowych potrzebne są dane dotyczące badanego produktu. Są one na tyle szczegółowe,
że nie występują w oficjalnych publikacjach – por. p. 2, a brak jest środków do zebrania
materiału statystycznego, lub jest to niemożliwe, bowiem potrzebne są dane historyczne);
b) z powodu braku dostępu do danych statystycznych (dane na temat konkurencyjnego
produktu zapewne istnieją, ale u konkurencji);
c) z powodu trudności w kwantyfikacji tych zmiennych (np. zmienne takie jak jakość, moda,
które mają istotny wpływ na kształtowanie się zjawisk rynkowych, lecz są trudno
mierzalne);
d) z powodu ich mało istotnego wpływu na badane zjawisko. Ten powód występowania
składnika losowego wynika z założenia, że model ekonometryczny powinien być
uproszczonym schematem kształtowania się badanego zjawiska. Oznacza to, że w modelu
powinniśmy uwzględniać zmienne „najważniejsze”, tak aby postronny badacz patrząc na
wyrażone przez nas czynniki mógł rozeznać się od czego przede wszystkim zależy dane
zjawisko. Na przykład nie można wprawdzie dowieść ze 100% pewnością, że liczba plam
na słońcu nie wpływa na popyt na komputery, ale nie jest to powód , aby uwzględniać tą
zmienną jako jeden z czynników ten popyt kształtujących. Nawet jeśli liczba plam na
słońcu wpływa na popyt na komputery, to jest to wpływ na pewno mniej istotny niż
11
Wykłady z Ekonometrii
12
dr Ewa Kusideł
wpływ innych czynników kształtujących popyt (cena, dochody, itp.), a zatem wpływ
takiej zmiennej (jeśli on istnieje) będzie przejawiał się w składniku losowym , bo jej
dołączenie z pewnością nie uprości, a wręcz skomplikuje zależności leżące u podstaw
popytu na komputery.
3.2.4. Etap 4: Estymacja
Estymacja (ang. estimate = szacować) to inaczej szacowanie parametrów, w wyniku którego
otrzymujemy liczbowe wartości parametrów 0, 1, ..., k , które nazywamy estymatorami
lub oszacowanymi parametrami. Estymacji można dokonać różnymi metodami. Dość
powszechnie stosowaną jest metoda najmniejszych kwadratów - MNK. Ma ona tę wadę, że
można ją zastosować do modeli liniowych względem parametrów. Czyli można nią
oszacować model (3.2.3a), ale już nie (3.2.3b) – w każdym razie nie bezpośrednio.
Jak już powiedziano oszacowane parametry strukturalne noszą nazwę estymatorów.
Estymatory często zapisuje się z „daszkiem” nad parametrem. Szczegóły szacowania
parametrów modeli ekonometrycznych podajemy w rozdziale 4, tutaj zaś podamy sposób ich
oszacowania w Excelu.
Do szacowania parametrów równań ekonometrycznych w Excelu służy dodatek Analiza
Danych, który znajduje się w menu Narzędzia. Jeżeli nie używano wcześniej tego dodatku
należy go zainstalować poprzez wykonanie następujących czynności:
1. W menu Narzędzia kliknij polecenie Dodatki i włącz dodatek AnalisisToolPak
(odpowiedzialny za Analizę Danych). Jeśli nie został on umieszczony w oknie
dialogowym Dodatki, kliknij przycisk Przeglądaj i znajdź stację dysków i folder, gdzie
znajduje się plik dodatku AnalisisToolPak o nazwie analys32.xla - zwykle jest to folder
ProgramFiles\MicrosoftOffice\Office\Analysis. Jeżeli nie możesz odnaleźć pliku, uruchom
program instalacyjny.
2. W oknie dialogowym Dodatki zaznacz pole wyboru AnalisisToolPak. Uwaga - dodatki,
których pola wyboru zaznaczono w oknie dialogowym Dodatki, są aktywne do czasu ich
usunięcia.
Aby oszacować liniowy model ekonometryczny należy:
1. W menu Narzędzia wybrać polecenie Analiza Danych, a następnie Regresja.
2. W pole „Zakres Wejściowy Y” wskazać myszką lub wpisać zakres zmiennej objaśnianej
modelu (jest to jeden szereg) z tytułem lub bez.
12
Wykłady z Ekonometrii
dr Ewa Kusideł
13
3. W polu „Zakres Wejściowy X” wskać myszką lub wpisać zakres zmiennych objaśnianych
modelu (jest to jeden szereg w przypadku jednej zmiennej objaśniającej, lub macierz, tzn.
kilka kolumn z danymi, w przypadku kilku zmiennych objaśniających) z tytułem lub bez.
4. Jeżeli wpisane zakresy zawierają tytuły, zaznaczyć to w polu „Tytuły”
5. Wcisnac OK.
Pokażemy to na przykładzie
Przykład 1 (źródło: Borkowski, [2003], s. 103)
Dane są wartości średniego spożycia owoców, dochody i płeć 12 losowo wybranych osób:
Nr
1
2
3
4
5
6
7
8
9
10
11
12
Oznaczmy:
Spożycie owocó (kg)
3,8
4,7
4,4
5,0
4,1
3,7
4,9
5,4
5,2
4,6
4,0
3,6
Dochody (tys. Zł)
2,0
2,1
1,8
2,7
3,0
3,5
5,0
4,5
4,2
3,8
2,4
1,4
Płeć
Mężczyzna
Kobieta
Kobieta
Kobieta
Mężczyzna
Mężczyzna
Kobieta
Mężczyzna
Kobieta
Mężczyzna
Mężczyzna
Mężczyzna
Y – miesięczne spożycie owoców w kg;
X – miesięczne dochody w tys. zł
Z – zmienna zero jedynkowa przyjmująca wartość jeden jeśli badana osoba jest kobietą i zero
w pozostałych przypadkach.
Model, który należy oszacować ma postać: Y=0+1X+2Z+
W Excelu wpisujemy dane i uzupełniamy tabelę regresji, tak jak to pokazano na rysunku 1.3.1
13
Wykłady z Ekonometrii
Rys.
Regresji
3.2.4a:
dr Ewa Kusideł
14
Wpisywanie
danych
do
okna
dialogowego
Po naciśnięciu OK. w okienku regresji pojawi się następująca ramka z wynikami:
Rys.
3.2.4b:
Wyniki
ekonometrycznego
działania
opcji
Regresja
–
oszacowania
modelu
14
Wykłady z Ekonometrii
15
dr Ewa Kusideł
W kolumnie zatytułowanej Współczynniki (komórka B16 na rys. 3.2.4b) znajdują się
oszacowane parametry strukturalne, pozwalające nam zapisać model następująco:
Y=3,27+0,31X+0,60Z
Wynika z tego, że oszacowane parametry strukturalne są następujące: 0=+3,27, 1=+0,31,
2=+0,60.
3.2.5. Etap 5: Interpretacja i/lub prognozowanie (przed interpretacją modelu należy go
poddać weryfikacji statystycznej)
Przy założeniu, że model jest poprawny (co sprawdzimy za pomocą szeregu statystyk
omawianych w rozdziale 5), a parametry istotne statystycznie (co później sprawdzimy za
pomocą statystyki t-Studenta-por. p. 5.2.3) możemy je zinterpretować jako:
1=0,31 oznacza, że wzrost miesięcznych dochodów o 1 tys. zł powoduje wzrost
miesięcznego spożycia owoców o 0,31 kg.
2=0,60 oznacza, że kobiety spożywają średnio o 0,60 kg owoców więcej od mężczyzn
Wyrazu wolnego 0=3,27 najczęściej nie interpretuje się.
Ogólnie, interpretacja parametrów liniowego modelu ekonometrycznego postaci (3.2.3a)
mówi na o ile zmieni się y wskutek zmiany x o jednostkę, czyli parametr j stojący przy
zmiennej xj mówi nam o ile zmienia się y (wzrośnie lub spadnie w zależności od znaku j)
jeżeli xj wzrośnie o jednostkę. Na tej podstawie można również rozważać, jak zmieni się y
wskutek zmian xj o wielokrotność lub część jednostki, a mianowicie jeśli xj wzrośnie o część
jednostki (np.,0.5, 0.3 itp.) to y zmieni się o odpowiednią część parametru j, ( np.0.5j,
0.3j, itd.). Jeśli xj zmieni się o odpowiednią wielokrotność swojej jednostki ( np. o 1.5; 2; 3
itd.) to y zmieni się o odpowiednią wielokrotność parametru j (np.1.5j , 2j, 3j itd.).
Podstawową zatem sprawą w interpretacji parametrów jest ustalenie czy podana zmiana xj
stanowi część, czy wielokrotność jego jednostki.
Poniżej podano kilka przykładów interpretacji estymatorów modeli
ekonometrycznych
Przykład 2
Funkcja popytu na ryby ma postać:
PA = 3 - 4CA + 5CB
gdzie:
PA- oznacza popyt na ryby bałtyckie w tonach;
15
Wykłady z Ekonometrii
dr Ewa Kusideł
16
CA- cena ryb bałtyckich w złotych;
CB- cena ryb importowanych w dolarach.
Zgodnie z podstawową interpretacją, wzrost (spadek) ceny ryb bałtyckich o 1 zł spowoduje
spadek popytu na nie o 4 tony, zaś wzrost ceny ryb importowanych o 1 zł spowoduje wzrost
popytu na ryby bałtyckie o 5 ton. Gdyby cena ryb bałtyckich wzrosła o 10 groszy, to jest o
0.1 część jednostki, którą jest złotówka (10 gr stanowi 0,1 zł), to zmiana spowoduje spadek
popytu o 4 x 0,1 (a nie o 4x10!) co daje 0,4 tony czyli 400 kg.
Weryfikacja statystyczna modelu
Głównym zadaniem analizy ekonometrycznej jest właściwe oszacowanie parametrów,
bowiem
dzięki
temu
możemy
zrealizować
główne
cele
szacowania
modelu
ekonometrycznego jakimi są:
1. Analiza zjawisk ekonomicznych – czynimy to poprzez interpretację oszacowanych
parametrów modelu.
2. Prognozowanie zjawisk ekonomicznych, o czym będzie mowa później
Zanim jednak dokonamy analiz i prognoz na podstawie modelu ekonometrycznego należy
sprawdzić na ile jest on „dobry”. Temu służą różnorakie statystyki obliczane w ramach
weryfikacji statystycznej modelu. Ogólnie, weryfikacja (sprawdzanie) modelu polega na jego
weryfikacji:
1. merytorycznej
2. statystycznej.
Weryfikacja merytoryczna modelu – polega na stwierdzeniu, czy oszacowane znaki
parametrów są zgodne z naszymi oczekiwaniami i przesłankami ekonomicznymi. Jeśli tak jest
to mówimy, że parametr jest merytorycznie poprawny, jeśli nie, to mówimy, że parametr jest
merytorycznie niepoprawny . Np. w funkcji popytu postaci PA = α0 + α1 CA + α2 RA + ξ
spodziewamy się następujących znaków:
-
przy zmiennej CA (cena badanego produktu) spodziewamy się, że α1 < 0, bo taki znak
sugeruje typowy wpływ ceny na popyt, a mianowicie, że wzrost ceny powoduje
spadek popytu;
-
przy zmiennej RA (reklama badanego produktu) spodziewamy się, że α2 > 0, bo taki
znak sugeruje, że wzrost nakładów na reklamę powoduje wzrost popytu.
Oszacowanie powyższej funkcji daje następujące rezultaty P A = -15,4 + 3,14 CA + 1,5 RA, co
oznacza, że:
α0 po oszacowaniu wynosi -15,4 (inaczej mówiąc estymator parametru 0 wynosi –15,4);
α1 po oszacowaniu wynosi +3,14 (inaczej mówiąc estymator parametru 1 wynosi +3,14);
16
Wykłady z Ekonometrii
17
dr Ewa Kusideł
α2 po oszacowaniu wynosi +1,5 (inaczej mówiąc estymator parametru 2 wynosi +1,5);
Porównanie znaków oszacowanych parametrów z ich spodziewanymi znakami
pozwala stwierdzić, że parametr α1 jest merytorycznie niepoprawny (bo wbrew temu czego
oczekiwaliśmy jest dodatni), a parametr α2 jest merytorycznie poprawny (bo zgodnie z tym
czego oczekiwaliśmy jest ujemny).
Analiza merytoryczna jest wstępem do analizy statystycznej w tym sensie, że dopiero wtedy,
gdy współczynniki pozytywnie przejdą etap analizy merytorycznej jest sens do przestąpienia
do analizy statystycznej modelu. W przypadku, gdy jeden lub więcej współczynników jest
merytorycznie niepoprawny model należy zdyskwalifikować, a przynajmniej usunąć daną
zmienną lub zmienne i ponownie oszacować parametry. W bardzo rzadkich przypadkach
uzyskanie niezgodnego z naszymi oczekiwaniami współczynnika jest wynikiem natrafienia na
pewną nietypowość ekonomiczną, a nie jego merytoryczną niepoprawność wynikającą
najczęściej ze złej jakości danych statystycznych.
Rolę badania merytorycznej poprawności znaków parametrów pokażemy na przykładzie
funkcji popytu na ryby bałtyckie rozważanej w przykładzie 2. Przypomnijmy, że funkcja ta
ma postać: PA = 3 - 4CA + 5CB, gdzie: PA- oznacza popyt na ryby bałtyckie w tonach, C Acena ryb bałtyckich w złotych, CB- cena ryb importowanych w dolarach.
Załóżmy dodatkowo, że ze względu na możliwość zepsucia się ryb bałtyckich należy
natychmiast sprzedać ich 2 tony. Z interpretacji parametrów funkcji wynika, że aby
zwiększyć popyt na ryby o 2 tony należy zmniejszyć ich cenę o 50 groszy. Gdyby powyższa
funkcja była źle oszacowana, a mianowicie otrzymalibyśmy na przykład PA = 3 + 1,5CA +
5CB, to w celu zwiększenia popytu na 2 tony poradzilibyśmy zwiększenie ceny o 1,5 złotego.
Podejmujemy zatem błędną decyzję skutkującą najprawdopodobniej zepsuciem się 2 ton ryb.
Aby takich sytuacji uniknąć, należy poddać model weryfikacji merytorycznej i statystycznej.
W powyższym przypadku zastosowanie analizy merytorycznej wskazuje na niepoprawność
parametru 1 i jest wystarczający do zakwestionowania modelu.
Weryfikacja statystyczna modelu
W ramach weryfikacji statystycznej interpretowane są dwie grupy statystyk. Pierwsza jest to
grupa statystyk mierzących „kondycję” modelu jako całości, np.: R2, czyli współczynnik
determinacji oraz Se, czyli błędy średnie równania. Następna grupa statystyk mierzy
„kondycję” poszczególnych parametrów i zmiennych. Należą do nich: S(άj), czyli błędy
średnie estymatorów (oszacowanych parametrów), statystyki t–studenta mierzące istotność
parametru i zmiennych oraz przedziały ufności dla parametrów mówiące nam o tym, z jakim
17
Wykłady z Ekonometrii
18
dr Ewa Kusideł
prawdopodobieństwem przedział o podanych krańcach pokrywa prawdziwą wartość
parametru. Szczegółowy opis tych miar znajduje się w rozdziale 5.
18
Download