Wykłady z Ekonometrii 1 dr Ewa Kusideł Wstęp Pomimo, że poniższe materiały mają za zadanie w jak największym stopniu ułatwić naukę ekonometrii, nie obejdzie się bez wprowadzenia formalnych określeń i definicji. Dlaczego? Otóż wbrew pozorom służy to ułatwieniu, a nie komplikowaniu wykładu. Czy wyobrażacie sobie na przykład lekarza, który w czasie operacji mówi do instrumentariuszki: podaj mi ów mały nóż o ostrzu jednostronnym lub na końcu dwustronnym 1? Zanim pielęgniarka zorientuje się, że chodzi o skalpel, pacjent może umrzeć. A co z prawnikiem, który mówi do kolegi idąc do sądu, że idzie do państwowego organu wymiaru sprawiedliwości2 myśląc o sądzie. Albo meteorologa, który mówi, że wzrośnie wielkość fizyczna równa stosunkowi siły działającej prostopadle na daną powierzchnię – do wielkości tej powierzchni3 zamiast powiedzieć, że wzrośnie ciśnienie. A możecie sobie wyobrazić definicję użytych powyżej słów: instrumentariuszka, prawnik, meteorolog?. Zajrzyjcie do słownika, i nie zdziwcie się, gdy wyjaśnienie będzie nie miej zrozumiałe niż samo słowo, jak w przypadku ciśnienia (bo o to chodziło w tym stosunku powierzchni). Każda dziedzina wytwarza swój specyficzny język; inżynierowie, prawnicy, lekarze, ekonomiści mają swój własny kod porozumiewania. Dlaczego?. Żeby było krócej i precyzyjniej. Czasami brak tej precyzji może tylko śmieszyć, jak w przypadku meteorologa, lecz czasem może mieć wagę ludzkiego życia, jak w przypadku niedouczonego lekarza. W ekonometrii nie podejmujemy na szczęście decyzji na taką miarę, lecz posługiwanie się pewnymi określeniami po prostu ułatwia sprawę. Początkowo te określenia takie jak składnik losowy, zmienna endogeniczna itd. będą dla nas trudne, ale to tylko dlatego, że są nowe. Czy trzeba wam teraz dokładnie wyjaśniać pojęcia takie jak substytut, dobro komplementarne, czy popyt? Nie, a przecież są to bardzo specjalistyczne nazwy. To że nie trzeba ich wyjaśniać wynika z „obycia” się z nimi, podobnie jak będzie po pewnym czasie z ekonometrią. A zatem kontynuujemy formalny wykład, na razie nie przejmując się za bardzo tymi formalnymi określeniami. Definicja przytoczona za Słownikiem języka polskiego, [1981], PWN, Warszawa, tom III, s.223 tamże, s 183 3 tamże, tom I, s 309 1 2 1 Wykłady z Ekonometrii 2 dr Ewa Kusideł 1. Informacje początkowe 1.1 Definicje ekonometrii Chow (1995): „Ekonometria jest nauką i sztuką stosowania metod statystycznych do mierzenia relacji ekonomicznych”. Pawłowski (1978): „Ekonometria jest nauką o metodach badania ilościowych prawidłowości występujących w zjawiskach ekonomicznych za pomocą odpowiednio wyspecjalizowanego aparatu matematyczno-statystycznego”. Maddala (2001): Ekonometria to zastosowanie metod statystycznych i matematycznych do analizy danych ekonomicznych w celu nadania teoriom ekonomicznym kontekstu empirycznego oraz ich potwierdzenia lub odrzucenia”. Ostateczna (nasza) definicja: „Ekonometria jest obszarem ekonomii zajmującym się zastosowaniem narzędzi statystycznych i matematycznych do empirycznego mierzenia i weryfikacji teorii postulowanych przez teorię ekonomii”. 1.2. Dziedziny pokrewne Ekonometrii Ekonomia matematyczna - zajmuje się matematycznym zapisem teorii ekonomicznych oraz tworzeniem modeli ekonomicznych, na podstawie których wyprowadzane są twierdzenia ekonomiczne. Ekonomia matematyczna nie zajmuje się empiryczną weryfikacją swoich twierdzeń - formułuje tylko pewne hipotezy dotyczące funkcji opisującej powiązania między badanymi zmiennymi ekonomicznymi. Badania operacyjne – to szereg metod wykorzystywanych do podejmowania decyzji optymalnych z punktu widzenia określonego celu, przy uwzględnieniu dających się zdefiniować ograniczeń technicznych, ekonomicznych. 1.3. Warunki stosowania ekonometrii: Znajomość teorii ekonomicznych. Jakie teorie ekonomiczne mogą być testowane w ramach ekonometrii?. Przykłady: Popytu – prawo popytu, Stopy procentowe – teoria podaży pieniądza, Inflacja – krzywa Phillipsa, Dochód - krzywe Engela, Produkcja –funkcja Cobb-Douglasa. Uwzględniane zjawiska ekonomiczne i pozaekonomiczne muszą być mierzalne lub sprowadzalne do mierzalnej postaci. Dostępne są dane statystyczne dotyczące badanych czynników, które posłużą do budowy zmiennych modelu. 2 Wykłady z Ekonometrii dr Ewa Kusideł 3 1.4. Rodzaje danych statystycznych 1. Szeregi czasowe (time series data TSD): xt for t=1,2,…,T. Przykład szeregu czasowego: Liczba zatrudnionych w Polsce w okresie 1. kwartał 1995 – 4. kwartał 2006 9500 9000 8500 8000 7500 7000 1 2 3 4 1 2 3 4 1 2 3 4 1 2 3 4 1 2 3 4 1 2 3 4 1 2 3 4 1 2 3 4 1 2 3 4 1 2 3 4 1 2 3 4 1 2 3 4 1995 1996 1997 1998 1999 2000 2001 2002 2003 2004 2005 2006 2. Dane przekrojowe lub przestrzenne4 (cross-section or spatial data CSD): xi for i=1,2,…,N. Przykład danych przekrojowych (przestrzennych): Liczba zatrudnionych w 4. kwartale 2006 w 16 województwach Polski ku do ja w l no sk ś o- l ąs po k m ie or sk ie lu be ls ki e lu bu sk i łó e m dzk ał i e o m pol az sk ow ie ie ck o ie po pol dk sk ar ie pa c po kie dl as po ki m e or sk ie ś w ar wi ę ślą s t m iń okr ki e z sk o- ysk m i az e za ur w s i ch e ki od lko e p ni o- ols po ki m e or sk ie 2500 2000 1500 1000 500 0 3. Dane panelowe lub przestrzenno-czasowe (panel data or cross-section time PD): xit for i=1,2,…,N; t=1,2,…,T. Przykład danych panelowych: Liczba zatrudnionych w 6 województwach Polski mierzona w 4 kolejnych kwartałach 2006 r 2209 1151 1116 1064 1068 741 880 741 929 725 929 702 920 1161 1305 1146 1378 2158 441 4Q2006 2133 442 1111 3Q2006 1348 2076 404 1096 1195 2Q2006 390 1Q2006 dolnośląskie kujawsko- lubelskie lubuskie łódzkie małopolskie mazowieckie pomorskie . W istocie pojęcie dane przekrojowe jest nieco szersze niż dane przestrzenne, bowiem uwzględnia fakt, że analizowane dane pochodzą nie tylko z poszczególnych punktów przestrzeni (jak w podanym przykładzie), ale mogą oznaczać dowolny obiekt, jak np. grupę gospodarstw domowych, lub grupę przedsiębiorstw. 4 3 Wykłady z Ekonometrii 4 dr Ewa Kusideł 2. Mierzenie zależności pomiędzy zjawiskami ekonomicznymi za pomocą korelacji Wygodnym sposobem opisu siły i kierunku wpływu jednej zmiennej na drugą jest współczynnik korelacji. Dodatnia korelacja (dokładnie dodatni współczynnik korelacji) oznacza, że wzrostowi (spadkowi) wartości pierwszej cechy np. X towarzyszy wzrost (spadek) wartości drugiej cechy Y. W przyrodzie, życiu i gospodarce znajdujemy szereg przykładów na dodatnią korelację, np. pomiędzy: - ilością spożywanego jedzenia (X) i wagą ciała (Y) – choć niektórych chudzielców to nie dotyczy; - ilością wypalanych papierosów (X) i prawdopodobieństwem zachorowania na raka płuc (Y), lub choroby układu krążenia (Y); - wilgotnością powietrza (X) i ilością komarów w lecie (Y); - żyznością gleby (X) i wzrostem roślin (Y); - dochodem (X) i popytem na dobra wyższego rzędu (Y); - reklamą (X) i popytem (Y). Gdy zależność pomiędzy dwoma cechami jest odwrotnie proporcjonalna mówimy, że są one ujemnie skorelowane. Ujemna korelacja (dokładnie ujemny współczynnik korelacji) oznacza, że wzrostowi (spadkowi) wartości pierwszej cechy (X) towarzyszy spadek (wzrost) wartości drugiej cechy (Y). Ujemną korelację możemy zaobserwować na przykład pomiędzy: - ilością spożywanego jedzenia (X) i sprawnością fizyczną (Y); - ilością wypalanych papierosów (X) i długością życia (Y); - wilgotnością powietrza (X) i ilością wypijanych napojów (Y); - żyznością gleby (X) i nieurodzajem (Y); - dochodem (X) i popytem na dobra niższego rzędu - reklamą dobra (X) i popytem na dobro konkurencyjne (Y); - cena dobra (X) i popyt na to dobro (Y)5. Możemy również mówić o braku korelacji, czy inaczej mówiąc o korelacji zerowej6, która oznacza, że wzrost (spadek) wartości cechy X nie towarzyszą zmiany wartości cechy Y. Korelacją zerową, czyli brakiem korelacji charakteryzuje się większość przypadkowo dobranych zjawisk. Brak korelacji, czyli zależności występuje na przykład pomiędzy: - ilością spożywanego jedzenia (X) i ilością komarów w lecie (Y); Od tej reguły są pewne wyjątki o których piszemy przy okazji korelacji C a - Pa W praktyce nie otrzymujemy współczynników korelacji, które są dokładnie równe 0. O braku korelacji mówimy więc, gdy współczynnik korelacji można ocenić jako nieistotny statystycznie, o czym będzie szerzej mowa w paragrafie poświęconym badaniu istotności zmiennych i parametrów. 5 6 4 Wykłady z Ekonometrii dr Ewa Kusideł 5 - ilością wypalanych papierosów (X) i wilgotnością powietrza (Y); - żyznością gleby (X) i ilością wypalanych papierosów; - dochodem (X) i popytem na dobra pierwszej potrzeby (Y)7. 2.1. Korelogramy (scatter diagram) Graficzną interpretacją siły i kierunku związku pomiędzy zmiennymi jest wykres zależności tych zmiennych. Taki wykres nazywamy korelogramem, lub wykresem skaterowym (ang. scatter diagram). Przykład: cena i popyt na produkt A (dane do przykładu znajdują się w pliku example1.xls) cena 2,40 2,30 popyt 136 151 2,20 2,20 2,10 2,00 1,90 1,80 1,70 157 157 185 199 235 246 271 1,60 294 Korelogram: wykres zależności pomiędzy ceną i popytem na produkt A demand (sale) 300 250 200 150 100 1,50 1,70 1,90 2,10 2,30 2,50 price 7 W tym przypadku mielibyśmy do czynienia ze słabą korelacją. 5 Wykłady z Ekonometrii 6 dr Ewa Kusideł Co nam mówi korelogram (o zależnościach liniowych): 1. Mówi nam o kierunku zależności. a. Rosnąca linia: dodatnia korelacja. b. Malejąca linia: ujemna korelacja. 2. Mówi nam o sile zależności. a. Im bardziej prostą linię formują punkty korelogramu tym silniejsza zależność. b. Im bardziej „okrągły” kształt formują punkty korelogramu, tym słabsza zależność. c. Prosta linia, lecz równoległa do którejkolwiek osi oznacza brak korelacji. 2.2. Definicja współczynnika koralacji Formuła na wyliczenie współcznynnika korelacji pomiędzy dwiema zmiennymi jest następująca: rxy cov( x, y ) sx sy 1 n ( xi x )( y i y ) n i 1 1 n ( xi x ) 2 n i 1 1 n ( yi y) 2 n i 1 2.3. Właściwości współczynnika korelacji 1. rxy jest miarą z przedziału (-1;1). 2. Moduł z rxy oznacza siłę związku. 3. Znak rxy oznacza kierunek powiązań pomiędzy x i y. Znak współczynnika korelacji (kierunek powiązań pomiędzy x i y) rxy <0 – ujemna korelacja: jeśli x rośnie (spada), to y spada (rośnie). rxy >0 – dodatnia korelacja: jeśli x rośnie (spada), to y rośnie (spada). Siła korelacji Moduł z rxy, którego wartość jest z przedział (0;1) informuje nas o sile związku pomiędzy dwoma zmiennymi. rxy = 0 - zmienne nie są powiązane, czyli nie są skorelowane. rxy =1 – bardzo silna korelacja pomiędzy zmiennymi. 6 Wykłady z Ekonometrii dr Ewa Kusideł 7 Przykład „ręcznego” obliczenia współczynnika korelacji (przykład ten znajduje się w pliku correlation_for_demand_A.xls) 27 3. Model ekonometryczny 3.1. Definicje Model ekonometryczny - jest podstawowym narzędziem w ekonometrii, służącym do analizy zależności zachodzących między różnymi zjawiskami. Model - jest uproszczonym odwzorowaniem rzeczywistości, uproszczoną reprezentacją realnego obiektu, realnej sytuacji lub realnego procesu. Jego cechą charakterystyczną jest, że: - uwzględnia tylko istotne cechy, najważniejsze z punktu widzenia określonego celu, - nie jest dokładną reprezentacją rzeczywistości. Pawłowski [1978]: „Model ekonometryczny jest to konstrukcja formalna, która za pomocą jednego równania lub układu równań przedstawia zasadnicze powiązania występujące pomiędzy rozpatrywanymi zjawiskami ekonomicznymi”. 7 Wykłady z Ekonometrii 8 dr Ewa Kusideł 3.2. Etapy budowy modelu ekonometrycznego 1. Sformułowanie hipotezy ekonomicznej: Y=f(X1,X2,…,Xk) 2. Zebranie danych 3. Ustalenie postaci analitycznej równania (równań) 4. Estymacja 5. Interpretacja i/lub prognozowanie (przed interpretacją modelu należy go poddać weryfikacji statystycznej) 3.2.1. ETAP 1: Sformułowanie hipotezy ekonomicznej Zależność pomiędzy interesującym nas zjawiskiem – y- a czynnikami go kształtującymi x1, x2, x3 itd. możemy zapisać jako: (3.2.1) y=f(x1, x2, ..., xk,…) Równanie (3.2.1) opisuje hipotezę ekonomiczną, która określa zjawisko ekonomiczne będące przedmiotem naszego zainteresowania (np. popyt jak w przypadku case study w rozdziale 8) i czynniki go kształtujące (w case study z rozdziału 8 są to: cena, dochody,...). Powiązania pomiędzy zmiennymi x1, x2, ..., xk a zmienną y znajdują swój formalny zapis w modelu ekonometrycznym, który jest równaniem (lub grupą równań) w którym rolę zmiennej objaśnianej (zwanej też engogeniczną lub i) pełni interesujące nas zjawisko ekonomiczne -y, a rolę zmiennych objaśniających (egzogenicznych, niezależnych)- czynniki go kształtujące, czyli iksy. Dla takiego równania charakterystyczne są zatem: zmienna objaśniana i objaśniające, postać analityczna związku który pomiędzy nimi zachodzi (funkcja liniowa, potęgowa i.t.d.- por. 1.2), parametry strukturalne (współczynniki funkcji), które mierzą siłę i kierunek wpływu poszczególnych zmiennych objaśniających na zmienną objaśnianą. Zwróćmy uwagę na trzykropek, który pojawił się w powyższym równaniu. Zamknięcie nawiasu bez jego uwzględnienia oznaczałoby, że wymieniliśmy wszystkie czynniki wpływające na na badane zjawisko y. Czy taka sytuacja jest możliwa?. Czy w przypadku jakiegokolwiek zjawiska będziemy mogli stwierdzić, że wyróżniliśmy wszystkie czynniki go kształtujące? Raczej nie, ze względu na czynniki nieprzewidywalne (pogoda, wojna) lub takie, których wpływ jest mało istotny (na przykład reklama rękawiczek skórzanych, pomocnych w prowadzeniu samochodu, może mieć wpływ na popyt na ten samochód, lecz jest to wpływ mało istotny).Trzykropek reprezentuje wpływ zjawisk nieuwglęnionych w modelu, który w modelach ekonometrycznych jest reprezentowany przez składnik losowy. 8 Wykłady z Ekonometrii 9 dr Ewa Kusideł 3.2.2. ETAP 2: Zebranie danych Dane statystyczne do modelu ekonometrycznego mogą pochodzić z wielorakich źródeł. Poniżej wymieniono kilka z nich: 1. dane zbierane przez GUS (Główny Urząd Statystyczny, w Łodzi na ul. Suwalskiej) powstające w wyniku ankietowania przedsiębiorców, zbierane w postaci miesięcznych lub kwartalnych szeregów i publikowane w Biuletynach Statystycznych. Błędy z tego rodzaju danych pochodzą od pracodawców, którzy z różnych powodów zawyżają lub zaniżają wartość różnych zmiennych (liczba i wynagrodzenie pracowników, obroty i zyski firmy i.t.p). dane pochodzące z badania budżetu gospodarstw domowych, których użyteczność jest ograniczona rzadkością przeprowadzonego badania (co kilka lat); 2. dane pochodzące z Urzędów Pracy; 3. dane z Badania Aktywności Ekonomicznej Ludności (mają postać szeregów kwartalnych i uznaje się je za jedne z bardziej reprezentatywnych); 4. dane pochodzące z ankiet przeprowadzanych na zamówienie konkretnego klienta. Błąd w tego rodzaju danych może wynikać z niereprezentatywnośći próby i nieprawdomówności respondentów. Bardzo często dzieje się tak, że zestaw zmiennych zaproponowanych w hipotezie ekonomicznej jest znacznie zredukowany ze względu na brak danych statystycznych. Brak ten może wynikać z faktu, że dane te nie istnieją, np. nie robiono wcześniej podobnych badań i posiadać dane na ten temat należy przeprowadzić własne badania ankietowe. Może się również zdarzyć, że dane istnieją, ale są dla badacza nie dostępne – jak w przypadku informacji o dobrach substytucyjnych wytwarzanych przez konkurencyjną firmę. 3.2.3. ETAP 3: Ustalenie postaci analitycznej równania Przypomnijmy, że równanie (3.2.1) opisuje zjawisko Y jako funkcję czynników go określających. Nie wiadomo natomiast jaki rodzaj funkcji należy zastosować: liniową, potęgową, wykładniczą i.t.d. Postać funkcyjna modelu powinna odzwierciedlać rzeczywiste interakcje pomiędzy zmiennymi, tzn. jeżeli zależność jest liniowa należy użyć funkcji liniowej, jeśli jest nieliniowa, należy użyć funkcji nieliniowej. Zależności liniowe, to inaczej mówiąc zależności proporcjonalne, czyli takie, dla których taka sama zmiana jednego czynnika powoduje taką samą zmianę drugiego. Mogą one być wprost proporcjonalne, gdy wzrost (spadek) jednej zmiennej powoduje wzrost (spadek) 9 Wykłady z Ekonometrii 10 dr Ewa Kusideł drugiej, oraz odwrotnie proporcjonalne, gdy wzrost (spadek) jednej zmiennej powoduje spadek (wzrost) drugiej. Można zastanowić się, czy typowe czynniki kształtujące popyt obrazują zależności liniowe, czy nieliniowe. Czy możemy założyć, że podobne przyrosty dochodów i reklamy będą powodować zawsze takie same przyrosty popytu. Gdyby tak było, to w przypadku reklamy moglibyśmy mówić o superecepcie na sukces, bo oznaczałoby to, że ciągły wrost wydatków na reklamę powoduje nieskończony przyrost popytu – a tak niestety nie jest. W przypadku dochodu, proporcjonalny wzrost popytu na jakieś dobro i usługę w porównaniu do wzrostu dochodu spowodowałoby, że bogaci ludzie byliby „zalani” potokiem dóbr, na które popyt powinien nieprzerwanie wzrastać. Czy kupimy bowiem następną suszarkę, telewizor tylko dlatego, że nas na to stać? Czy będziemy wychodzić codziennie do kina, fryzjera, kosmetyczki, tylko dlatego, że rosnący dochód, zgodnie z relacją liniową, powinien się przełożyć na proporcjonalny wzrost popytu na te usługi? Odpowiedź na powyższe pytania jest negatywna: zarówno wpływ reklamy jak i dochodu nie wpływa liniowo na popyt, lecz po osiągnięciu pewnego pułapu popyt stabilizuje się na pewnym poziomie (jest to punkt nasycenia, stabilizacji wydatków, lub w przypadku reklamy punkt nasycenia rynku)8. Matematycznie rzecz ujmując do opisania zależności pomiędzy dochodem, reklamą i popytem powinniśmy użyć funkcji, która posiada asymptotę poziomą, która będzie odzwierciedlała stabilizację popytu na pewnym poziomie9. Funkcjami takimi są funkcje wymierne, które w przypadku, gdy opisują relacje pomiędzy dochodami i wydatkami na określone grupy dóbr, opisywane w teorii Engle’a. Szersze omówienie tej kwestii znajduje się w rozdziale 8 dotyczącym Modeli Törnquista. W praktyce, na szczęście dla większości studentów, głównym zadaniem w przypadku doboru postaci funkcyjnej modelu, jest stwierdzenie, czy dana zależność ma postać liniową czy krzywoliniową10. W pierwszym wypadku używamy naturalnie funkcji liniowej, w drugim zaś używamy najczęściej funkcji potęgowej, której pewne własności predysponują ją do opisu nieliniowych zależności11. Jeżeli możemy założyć, że poziom wydatków na dane dobre jest daleki od stabilizacji możemy zastosować funkcję liniową. Szersze omówienie tej kwestii znajduje się w załączniku pt. Model Allena-Bowleya. 9 Nawiasem mówiąc, fakt, że wiele zjawisk ekonomicznych “układa się” w znane z matematyki wykresy funkcji, jest fundamentem ekonometrii, bo skłonił naukowców do próby opisu tych zjawisk za pomocą tych funkcji. 10 Pełny zestaw nieliniowych funkcji trendu znajduje się w rozdziale 7. 11 Mowa tu o dogodnej interpretacji parametrów tej funkcji w kategoriach elastyczności. O ile jednak w przypadku nieliniowych zależności przyczynowo-skutkowych najwygodniej jest używać funkcji potęgowej, to w takim samym przypadku używamy funkcji wykładniczej dla modeli trendu. 8 10 Wykłady z Ekonometrii 11 dr Ewa Kusideł Funkcja liniowa (jednorównaniowy model liniowy) ma postać: (3.2.3a) y=0+1x1+2x2+...+k+ Funkcja potęgowa (jednorównaniowy model potęgowy) ma postać: (3.2.3b) y=0 x11x22… xkke gdzie: 0 – wyraz wolny równania, 1,...,k – parametry strukturalne, - składnik losowy. W ten sposób – po odrzuceniu zmiennych na temat których nie udało się zebrać danych i po ustaleniu postaci funkcyjnej - hipoteza ekonomiczna (3.2.1) zamienia się w model ekonometryczny. Zwróćmy uwagę, że miejsce trzykropka zajął teraz tzw. składnik losowy. Powody występowania składnika losowego w równaniach ekonometrycznych można wyjaśnić następującymi przyczynami: 1. Nieuwzględnieniu wszystkich zmiennych. Należy tu rozróżnić jednakże różne przyczyny nieuwzględniania zmiennych: a) z powodu braku danych statystycznych na temat badanej zmiennej (np. w badaniach rynkowych potrzebne są dane dotyczące badanego produktu. Są one na tyle szczegółowe, że nie występują w oficjalnych publikacjach – por. p. 2, a brak jest środków do zebrania materiału statystycznego, lub jest to niemożliwe, bowiem potrzebne są dane historyczne); b) z powodu braku dostępu do danych statystycznych (dane na temat konkurencyjnego produktu zapewne istnieją, ale u konkurencji); c) z powodu trudności w kwantyfikacji tych zmiennych (np. zmienne takie jak jakość, moda, które mają istotny wpływ na kształtowanie się zjawisk rynkowych, lecz są trudno mierzalne); d) z powodu ich mało istotnego wpływu na badane zjawisko. Ten powód występowania składnika losowego wynika z założenia, że model ekonometryczny powinien być uproszczonym schematem kształtowania się badanego zjawiska. Oznacza to, że w modelu powinniśmy uwzględniać zmienne „najważniejsze”, tak aby postronny badacz patrząc na wyrażone przez nas czynniki mógł rozeznać się od czego przede wszystkim zależy dane zjawisko. Na przykład nie można wprawdzie dowieść ze 100% pewnością, że liczba plam na słońcu nie wpływa na popyt na komputery, ale nie jest to powód , aby uwzględniać tą zmienną jako jeden z czynników ten popyt kształtujących. Nawet jeśli liczba plam na słońcu wpływa na popyt na komputery, to jest to wpływ na pewno mniej istotny niż 11 Wykłady z Ekonometrii 12 dr Ewa Kusideł wpływ innych czynników kształtujących popyt (cena, dochody, itp.), a zatem wpływ takiej zmiennej (jeśli on istnieje) będzie przejawiał się w składniku losowym , bo jej dołączenie z pewnością nie uprości, a wręcz skomplikuje zależności leżące u podstaw popytu na komputery. 3.2.4. Etap 4: Estymacja Estymacja (ang. estimate = szacować) to inaczej szacowanie parametrów, w wyniku którego otrzymujemy liczbowe wartości parametrów 0, 1, ..., k , które nazywamy estymatorami lub oszacowanymi parametrami. Estymacji można dokonać różnymi metodami. Dość powszechnie stosowaną jest metoda najmniejszych kwadratów - MNK. Ma ona tę wadę, że można ją zastosować do modeli liniowych względem parametrów. Czyli można nią oszacować model (3.2.3a), ale już nie (3.2.3b) – w każdym razie nie bezpośrednio. Jak już powiedziano oszacowane parametry strukturalne noszą nazwę estymatorów. Estymatory często zapisuje się z „daszkiem” nad parametrem. Szczegóły szacowania parametrów modeli ekonometrycznych podajemy w rozdziale 4, tutaj zaś podamy sposób ich oszacowania w Excelu. Do szacowania parametrów równań ekonometrycznych w Excelu służy dodatek Analiza Danych, który znajduje się w menu Narzędzia. Jeżeli nie używano wcześniej tego dodatku należy go zainstalować poprzez wykonanie następujących czynności: 1. W menu Narzędzia kliknij polecenie Dodatki i włącz dodatek AnalisisToolPak (odpowiedzialny za Analizę Danych). Jeśli nie został on umieszczony w oknie dialogowym Dodatki, kliknij przycisk Przeglądaj i znajdź stację dysków i folder, gdzie znajduje się plik dodatku AnalisisToolPak o nazwie analys32.xla - zwykle jest to folder ProgramFiles\MicrosoftOffice\Office\Analysis. Jeżeli nie możesz odnaleźć pliku, uruchom program instalacyjny. 2. W oknie dialogowym Dodatki zaznacz pole wyboru AnalisisToolPak. Uwaga - dodatki, których pola wyboru zaznaczono w oknie dialogowym Dodatki, są aktywne do czasu ich usunięcia. Aby oszacować liniowy model ekonometryczny należy: 1. W menu Narzędzia wybrać polecenie Analiza Danych, a następnie Regresja. 2. W pole „Zakres Wejściowy Y” wskazać myszką lub wpisać zakres zmiennej objaśnianej modelu (jest to jeden szereg) z tytułem lub bez. 12 Wykłady z Ekonometrii dr Ewa Kusideł 13 3. W polu „Zakres Wejściowy X” wskać myszką lub wpisać zakres zmiennych objaśnianych modelu (jest to jeden szereg w przypadku jednej zmiennej objaśniającej, lub macierz, tzn. kilka kolumn z danymi, w przypadku kilku zmiennych objaśniających) z tytułem lub bez. 4. Jeżeli wpisane zakresy zawierają tytuły, zaznaczyć to w polu „Tytuły” 5. Wcisnac OK. Pokażemy to na przykładzie Przykład 1 (źródło: Borkowski, [2003], s. 103) Dane są wartości średniego spożycia owoców, dochody i płeć 12 losowo wybranych osób: Nr 1 2 3 4 5 6 7 8 9 10 11 12 Oznaczmy: Spożycie owocó (kg) 3,8 4,7 4,4 5,0 4,1 3,7 4,9 5,4 5,2 4,6 4,0 3,6 Dochody (tys. Zł) 2,0 2,1 1,8 2,7 3,0 3,5 5,0 4,5 4,2 3,8 2,4 1,4 Płeć Mężczyzna Kobieta Kobieta Kobieta Mężczyzna Mężczyzna Kobieta Mężczyzna Kobieta Mężczyzna Mężczyzna Mężczyzna Y – miesięczne spożycie owoców w kg; X – miesięczne dochody w tys. zł Z – zmienna zero jedynkowa przyjmująca wartość jeden jeśli badana osoba jest kobietą i zero w pozostałych przypadkach. Model, który należy oszacować ma postać: Y=0+1X+2Z+ W Excelu wpisujemy dane i uzupełniamy tabelę regresji, tak jak to pokazano na rysunku 1.3.1 13 Wykłady z Ekonometrii Rys. Regresji 3.2.4a: dr Ewa Kusideł 14 Wpisywanie danych do okna dialogowego Po naciśnięciu OK. w okienku regresji pojawi się następująca ramka z wynikami: Rys. 3.2.4b: Wyniki ekonometrycznego działania opcji Regresja – oszacowania modelu 14 Wykłady z Ekonometrii 15 dr Ewa Kusideł W kolumnie zatytułowanej Współczynniki (komórka B16 na rys. 3.2.4b) znajdują się oszacowane parametry strukturalne, pozwalające nam zapisać model następująco: Y=3,27+0,31X+0,60Z Wynika z tego, że oszacowane parametry strukturalne są następujące: 0=+3,27, 1=+0,31, 2=+0,60. 3.2.5. Etap 5: Interpretacja i/lub prognozowanie (przed interpretacją modelu należy go poddać weryfikacji statystycznej) Przy założeniu, że model jest poprawny (co sprawdzimy za pomocą szeregu statystyk omawianych w rozdziale 5), a parametry istotne statystycznie (co później sprawdzimy za pomocą statystyki t-Studenta-por. p. 5.2.3) możemy je zinterpretować jako: 1=0,31 oznacza, że wzrost miesięcznych dochodów o 1 tys. zł powoduje wzrost miesięcznego spożycia owoców o 0,31 kg. 2=0,60 oznacza, że kobiety spożywają średnio o 0,60 kg owoców więcej od mężczyzn Wyrazu wolnego 0=3,27 najczęściej nie interpretuje się. Ogólnie, interpretacja parametrów liniowego modelu ekonometrycznego postaci (3.2.3a) mówi na o ile zmieni się y wskutek zmiany x o jednostkę, czyli parametr j stojący przy zmiennej xj mówi nam o ile zmienia się y (wzrośnie lub spadnie w zależności od znaku j) jeżeli xj wzrośnie o jednostkę. Na tej podstawie można również rozważać, jak zmieni się y wskutek zmian xj o wielokrotność lub część jednostki, a mianowicie jeśli xj wzrośnie o część jednostki (np.,0.5, 0.3 itp.) to y zmieni się o odpowiednią część parametru j, ( np.0.5j, 0.3j, itd.). Jeśli xj zmieni się o odpowiednią wielokrotność swojej jednostki ( np. o 1.5; 2; 3 itd.) to y zmieni się o odpowiednią wielokrotność parametru j (np.1.5j , 2j, 3j itd.). Podstawową zatem sprawą w interpretacji parametrów jest ustalenie czy podana zmiana xj stanowi część, czy wielokrotność jego jednostki. Poniżej podano kilka przykładów interpretacji estymatorów modeli ekonometrycznych Przykład 2 Funkcja popytu na ryby ma postać: PA = 3 - 4CA + 5CB gdzie: PA- oznacza popyt na ryby bałtyckie w tonach; 15 Wykłady z Ekonometrii dr Ewa Kusideł 16 CA- cena ryb bałtyckich w złotych; CB- cena ryb importowanych w dolarach. Zgodnie z podstawową interpretacją, wzrost (spadek) ceny ryb bałtyckich o 1 zł spowoduje spadek popytu na nie o 4 tony, zaś wzrost ceny ryb importowanych o 1 zł spowoduje wzrost popytu na ryby bałtyckie o 5 ton. Gdyby cena ryb bałtyckich wzrosła o 10 groszy, to jest o 0.1 część jednostki, którą jest złotówka (10 gr stanowi 0,1 zł), to zmiana spowoduje spadek popytu o 4 x 0,1 (a nie o 4x10!) co daje 0,4 tony czyli 400 kg. Weryfikacja statystyczna modelu Głównym zadaniem analizy ekonometrycznej jest właściwe oszacowanie parametrów, bowiem dzięki temu możemy zrealizować główne cele szacowania modelu ekonometrycznego jakimi są: 1. Analiza zjawisk ekonomicznych – czynimy to poprzez interpretację oszacowanych parametrów modelu. 2. Prognozowanie zjawisk ekonomicznych, o czym będzie mowa później Zanim jednak dokonamy analiz i prognoz na podstawie modelu ekonometrycznego należy sprawdzić na ile jest on „dobry”. Temu służą różnorakie statystyki obliczane w ramach weryfikacji statystycznej modelu. Ogólnie, weryfikacja (sprawdzanie) modelu polega na jego weryfikacji: 1. merytorycznej 2. statystycznej. Weryfikacja merytoryczna modelu – polega na stwierdzeniu, czy oszacowane znaki parametrów są zgodne z naszymi oczekiwaniami i przesłankami ekonomicznymi. Jeśli tak jest to mówimy, że parametr jest merytorycznie poprawny, jeśli nie, to mówimy, że parametr jest merytorycznie niepoprawny . Np. w funkcji popytu postaci PA = α0 + α1 CA + α2 RA + ξ spodziewamy się następujących znaków: - przy zmiennej CA (cena badanego produktu) spodziewamy się, że α1 < 0, bo taki znak sugeruje typowy wpływ ceny na popyt, a mianowicie, że wzrost ceny powoduje spadek popytu; - przy zmiennej RA (reklama badanego produktu) spodziewamy się, że α2 > 0, bo taki znak sugeruje, że wzrost nakładów na reklamę powoduje wzrost popytu. Oszacowanie powyższej funkcji daje następujące rezultaty P A = -15,4 + 3,14 CA + 1,5 RA, co oznacza, że: α0 po oszacowaniu wynosi -15,4 (inaczej mówiąc estymator parametru 0 wynosi –15,4); α1 po oszacowaniu wynosi +3,14 (inaczej mówiąc estymator parametru 1 wynosi +3,14); 16 Wykłady z Ekonometrii 17 dr Ewa Kusideł α2 po oszacowaniu wynosi +1,5 (inaczej mówiąc estymator parametru 2 wynosi +1,5); Porównanie znaków oszacowanych parametrów z ich spodziewanymi znakami pozwala stwierdzić, że parametr α1 jest merytorycznie niepoprawny (bo wbrew temu czego oczekiwaliśmy jest dodatni), a parametr α2 jest merytorycznie poprawny (bo zgodnie z tym czego oczekiwaliśmy jest ujemny). Analiza merytoryczna jest wstępem do analizy statystycznej w tym sensie, że dopiero wtedy, gdy współczynniki pozytywnie przejdą etap analizy merytorycznej jest sens do przestąpienia do analizy statystycznej modelu. W przypadku, gdy jeden lub więcej współczynników jest merytorycznie niepoprawny model należy zdyskwalifikować, a przynajmniej usunąć daną zmienną lub zmienne i ponownie oszacować parametry. W bardzo rzadkich przypadkach uzyskanie niezgodnego z naszymi oczekiwaniami współczynnika jest wynikiem natrafienia na pewną nietypowość ekonomiczną, a nie jego merytoryczną niepoprawność wynikającą najczęściej ze złej jakości danych statystycznych. Rolę badania merytorycznej poprawności znaków parametrów pokażemy na przykładzie funkcji popytu na ryby bałtyckie rozważanej w przykładzie 2. Przypomnijmy, że funkcja ta ma postać: PA = 3 - 4CA + 5CB, gdzie: PA- oznacza popyt na ryby bałtyckie w tonach, C Acena ryb bałtyckich w złotych, CB- cena ryb importowanych w dolarach. Załóżmy dodatkowo, że ze względu na możliwość zepsucia się ryb bałtyckich należy natychmiast sprzedać ich 2 tony. Z interpretacji parametrów funkcji wynika, że aby zwiększyć popyt na ryby o 2 tony należy zmniejszyć ich cenę o 50 groszy. Gdyby powyższa funkcja była źle oszacowana, a mianowicie otrzymalibyśmy na przykład PA = 3 + 1,5CA + 5CB, to w celu zwiększenia popytu na 2 tony poradzilibyśmy zwiększenie ceny o 1,5 złotego. Podejmujemy zatem błędną decyzję skutkującą najprawdopodobniej zepsuciem się 2 ton ryb. Aby takich sytuacji uniknąć, należy poddać model weryfikacji merytorycznej i statystycznej. W powyższym przypadku zastosowanie analizy merytorycznej wskazuje na niepoprawność parametru 1 i jest wystarczający do zakwestionowania modelu. Weryfikacja statystyczna modelu W ramach weryfikacji statystycznej interpretowane są dwie grupy statystyk. Pierwsza jest to grupa statystyk mierzących „kondycję” modelu jako całości, np.: R2, czyli współczynnik determinacji oraz Se, czyli błędy średnie równania. Następna grupa statystyk mierzy „kondycję” poszczególnych parametrów i zmiennych. Należą do nich: S(άj), czyli błędy średnie estymatorów (oszacowanych parametrów), statystyki t–studenta mierzące istotność parametru i zmiennych oraz przedziały ufności dla parametrów mówiące nam o tym, z jakim 17 Wykłady z Ekonometrii 18 dr Ewa Kusideł prawdopodobieństwem przedział o podanych krańcach pokrywa prawdziwą wartość parametru. Szczegółowy opis tych miar znajduje się w rozdziale 5. 18