R E G R E S J A L I N I O W A *Dwie zmienne ilościowe:* 1 zależna (Y) P R O S T A 1 niezależna (X) Y = β 0 + β1 X + ε b0,b1-parametry trzeci parametr: σ 2 (wariancja błędu losowego) b0-wyraz wolny b1-współczynnik kierunkowy *Miara dopasowania modelu do danych R^2 <0;1> Współczynnik determinacji: R^2- jego wartość odpowiada na pytanie: w j a k i m % z m i e n n o ś ć z m i e n n e j zależnej Y została wyjaśniona przez model. *Istotność zmiennych* test T-studenta (do badania istotności) *Istotność modelu* F *Ilość parametrów* Zawsze 3 Y=b0+b1x+E Parametrów w regresjach jest tyle ile zmiennych niezależnych (X) plus dwa. ( b0 i b1 estymatory parametrów) *Duża próba n>=30* *Założenia: Homoskedastyczność (stałość reszt), Normalność kurtoza, skośność[standaryzowane składniki resztowe]należą do przedziału od -1do 1) jeśli obserwacji więcej niż 30 – dowolny rozkład. jeśli obserwacji mniej niż 30 – dodatkowe założenie dotyczące reszt Ε ~ N(0, σ 2 ) Autokorelacja. *Przyrost krańcowy (przyrost jednostkowy)* przykład:X=-3,89+0,2X1+0,002X2 przyrost krańcowy X1=0,2 pkX2=0,002 *Elastyczność (zmiany procentowe)* *współczynnik korelacji =R (wielokrotność R) (Znak współczynnika korelacji i znak stojący przy b1 są zawsze takie same) *X;Y-silna KORELACJA* *MSE tj estymator parametru (zawsze będzie jedno MSE) Jeżeli usuwamy obserwacje odstajaca: zmniejsza się MSE, zwiększa się R^2. Składniki: -resztowe (średnia tych reszt równa się 0). -standaryzowane składniki resztowe, przedział <-3;3> *Obserwacja odstająca - (King-Kong) *Testy istotności : do badania całego modelu: Test F: H0: R^2=0. HA:R^2>0. Istotność F-mniejsza od 5%. do badania parametru: test t-studenta (służy do badania istotności parametru) testujemy b0 i b1: H0:b0=0 HA:b0 różne od zera. H0:b1=0 HA:b1 różne od zer *Do wyznaczenia ELASTYCZNOŚCI z równania prognozy regresji liniowej prostej potrzeba: -średnich lub modalnych ; -średnich lub median* Prognozowanie w modelu regresji liniowej prostej.Po oszacowaniu metodą najmniejszych kwadratów otrzymujemy estymatory β 0 , β1 parametrów: . Wobec tego równanie prognozy ma postać: Y = β0 + β1 X (charakter β 0 , β1 deterministyczny) REGRESJA LINIOW WIELOKROTNA *3 zmienne ilościowe* zawsze JEDNA zależna(Y) DWIE zmienne niezależne (X) *Miara dopasowania R^2 należy<0,1> i dopasowany R^2 (informuje nas że w modelu są jakieś zmienne niezależne X, które można usunąć). R^2 - R^2 dopasowane <5% (jeśli różnica jest większa, to model zawiera zbyt dużo zmiennych niezależnych i należy usunąć którąś z modelu i przeliczyć model raz jeszcze z użyciem np. arkusza) *Istotność zmiennych (parametr) t-studenta *Istotność modelu F *Ilość parametrów Y=b0+b1X1+b2X2+...+bNXN+E Parametrów w regresjach jest tyle ile zmiennych niezależnych (X) dodać dwa . *Duża próba co najmniej 15 obserwacji na 1 "X" *Założenia: Homoskedastyczność(stałość reszt), Normalność (kurtoza, skośność[ standaryzowane składniki resztowe ]należą do przedziału od -1do 1) ,autokorelacja. *Przyrost krańcowy (przyrost jednostkowy)* przykład:X=-3,89+0,2X1+0,002X2 przyrost krańcowy X1=0,2 pkX2=0,002 *Elastyczność Ex1=Pkx1* x1/y ; Ex2=Pkx2*x2/y *X1;Y- silna korelacja. X2;Y-silna korelacja. X1;X2-słaba korelacja. *Parametr T (służy do testowania istotności pomiarów) *Prognozowanie w regresji - nożyce regresji* A N A L I Z A W A R I A N C J I Jeżeli pojawia się porównanie czegoś w regionach, obszarach, liniach lotniczych to zawsze będzie analiza wariancji. *2 zmienne. czynnik zawsze będzie jakościowy a np.zarobki to będą replikacje ilościowe 1 zmienna- jakościowa (niezależna) np:region 1 zmienna- ilościowa (zależna) np:zarobki *W analizie wariancji PORÓWNUJEMY ŚREDNIE *Test F używany jest do porównywania ze sobą średnich.* *Jest zawsze tylko jeden czynnik jakościowy. *Założenia HOMOSKEDASTYCZNOŚĆ (chroni nas przed błędem) Są dwie możliwości sprawdzenia: 1.Reguła kciuka - Hartleya: max.liczba z wariancji min.liczba z wariancji. 9(zawsze)> max/min. jeżeli jest mniejsze od 9 to jest homoskedastyczność, a jeżeli jest większe od 9 to nie ma homoskedastyczności. LSD- technika PORÓWNANIA WIELOKROTNEGO (pozwala na połączenie bliskich sobie liczb w grupy). Służy 2.TEST BARTLETA *Hipoteza 0. p<5% to H0 odrzucamy. p>5% to H0 nie odrzucamy. *Korelacja = wielokrotność R M O D E L C O B B A - D O U G L A S A *Zmienne ilościowe zmienna zależna Q(Produkcja Q) zmienne niezależne X1,X2,X3,....,Xn (Maszyny(X1) Energia (X2) Praca(X3) - czynniki produkcji.) *MODEL LINIOWY (funcja produkcji) (w modelu liniowym przyrosty krańcowe to elastyczność) *MODEL POTĘGOWY (funcja produkcji, uogólniona postać funkcji Cobba-Douglasa) (w modelu potęgowym wykładniki to elastyczność) Q=b0*X1^b1 * X2^b2 *....* Xk^bk bo,b1,b2,bk=parametry. przykład:Q=-0,81*X1 ^ 0,34 * X2 ^0,72 elastyczność: EX1=0,34 (b1) Odp. jeżeli nakłady czynników produkcji X1(środki trwałe) wzrosną o 1% to produkcja końcowa(Q) wzrośnie o 0,34%, EX2=0,72 (b2)--jeżeli X2 wzrośnie o 1% to produkcja końcowa(Q) wzrośnie o 0,72%. *Operacja zwana logarytmowaniem służy do tego aby obliczyć estymatory parametrów w modelu Cobba-Douglasa.* -Popyt: determinanty, produkcja i czynniki produkcji. -Produkt przeciętny(PP): przykład: Q=1,68*X1^0,33*X2^0,5 X1=508,1 ;X2=521,1. PPX1=Q/X1=464,4/508,1=0,91 PPX2=Q/X2=464,4/521,1=0,89 -Przyrost krańcowy: PKX1=EX1*PPX1=0,33*0,91=0,3(30 gr). PKX2=EX2*PPX2=0,57*0,89=0,5 (50 gr) Odp. Produkt przeciętny -z jednej jednostki czynnika produkcji X1 można było przeciętnie uzyskać 0,91 jednostki produkcji całkowitej. -jeżeli należność czynnika X1 wzrośnie o 1 jednostkę to produkcja końcowa wzrośnie o 0,3 *EFEKT SKALI PRODUKCJI (ESP) przykład: ESP=0,33+0,57=0,90. ESP=1 to produkcja rośnie tak samo szybko jak nakłady czynników produkcji. ESP<1 to produkcja rośnie wolniej stopniu niż nakłady produkcji. ESP>1 to produkcja rośnie szybciej niż nakłady produkcji. A N A L I Z A P O P Y T U Do analizy popytu na dane dobro wykorzystujemy: modele potęgowe (częściej wykorzystywane, np. ), P = 1,2C -2 , 02 C1k, 55 R 2 ,12 R 1k, 23 D1 , 89 modele liniowe (np. ) P = -150,14 - 1,54C + 4,36R + 2,13D + 0,89Ck ELASTYCZNOŚĆ POPYTU -odsetek zmian w popycie wynikający ze zmiany o 1% jednej ze zmiennych niezależnych (przy założeniu ceteris paribus) Równanie popytu na maśło Masmix vs Rama— przykład m.potęgowego: Q=5,0 * C^-0,17 * D^0,15 * Ck^0,30 * R^0,5 * Rk^-0,70 (C-cena ; D-dochód ; Ck-cena konkurenta ; R-reklama ; Rk-reklama konkurenta ; Q-wielkość popytu) Elastyczność cenowa popytu (zwykła) Ec=-0,17. W jakim stopniu 1% zmiana ceny wpływa na popyt? Jeżeli cena wzrośnie o 1% to popyt spadnie o 0,17%. Elastyczność cenowa krzyżowa popytu (mieszana) Eck=0,30 Jeżeli cena dobra konkurenta wzrośnie o 1% to popyt na nasze dobro wzrośnie o 0,3%. Elastyczność dochodowa popytu Ed=0,15 Elastyczność popytu względem wydatków na reklamę Er=0,50 Elastyczność popytu względem wydatków konkurencji na reklamę Erk=-0,70 Elastyczność cenowa popytu Jeżeli Ec<-1 popyt elastyczny. przykład:Ec=-2,0 Jeżeli cena wzrośnie o 1% to popyt spada o 2%. Ec należy do przedziału <-1;0> popyt nieelastyczny. przykład:Ec=-0,7 Jeżeli cena wzrośnie o 1% to popyt spadnie o 0,7% Ec>0 popyt odwrotnie proporcjonalny. przykład:Ec=0,3 Jeżeli cena wzrasta o 1% to popyt wzrasta o 0,3%. Ec=0 popyt sztywny. popyt nie reaguje na zmianę ceny. Trzy przypadki elastyczności cenowej popytu: popyt elastyczny(Ec<-1) -popyt spada(wzrasta)w większym stopniu niż wzrasta (spada)cena popyt proporcjonalny (Ec=-1) - popyt spada(wzrasta) w takim samym stopniu jak wzrasta (spada) cena. popyt nieelastyczny Ec należy do przedziału <-1;0> S T A T Y S T Y K I Kurioza Skośność Kwartyl : O P I S O W E miara spłaszczenia. miara symetrii. dolny=0,25; mediana=0,50 górny=o,75. przykład: kwartyl dolny 0,25= 25%<2949 0,25=75%>2949. kwartyl górny 0,75= 75%<4082 0,75=25%>4082 *Przedział ufności dla średniej: [X - zα \2 * σ/√n ; X + zα \2 * σ/√n] (X-średnia, σ-odchylenie standarowe, n-liczba obserwacji,zα \2-w tablicach.) poziom ufności= 1- α=0,95 ; α=0,05 ; α\2 = 0,025 Jeżeli próbka jest mniejsza niż 30 nie może być rozkład normalny. Rozkład normalny gdy kurtoza i skośność mieszczą się w przedziale od 1do -1. do wyznaczania wartości skrajnych (min. lub max.) jak wskazać np.region o najwyższych zarobkach Metodę LSD można zastosować tylko wtedy jeżeli odrzucamy Hipotezę 0. 1