REGRESJA LINIOWA PROSTA

advertisement
R E G R E S J A
L I N I O W A
*Dwie zmienne ilościowe:* 1 zależna (Y)
P R O S T A
1 niezależna (X)
Y = β 0 + β1 X + ε b0,b1-parametry trzeci parametr:
σ 2 (wariancja błędu losowego)
b0-wyraz wolny b1-współczynnik kierunkowy
*Miara dopasowania modelu do danych
R^2 <0;1>
Współczynnik determinacji: R^2- jego wartość odpowiada na pytanie: w j a k i m % z m i e n n o ś ć z m i e n n e j
zależnej Y została wyjaśniona przez model.
*Istotność zmiennych* test T-studenta (do badania istotności)
*Istotność modelu* F
*Ilość parametrów*
Zawsze 3
Y=b0+b1x+E Parametrów w regresjach jest tyle ile zmiennych
niezależnych (X) plus dwa. ( b0 i b1 estymatory parametrów)
*Duża próba n>=30*
*Założenia:
Homoskedastyczność (stałość reszt),
Normalność kurtoza, skośność[standaryzowane składniki resztowe]należą do
przedziału od -1do 1)
jeśli obserwacji więcej niż 30 – dowolny rozkład.
jeśli obserwacji mniej niż 30 – dodatkowe założenie dotyczące reszt
Ε
~
N(0, σ 2 )
Autokorelacja.
*Przyrost krańcowy (przyrost jednostkowy)*
przykład:X=-3,89+0,2X1+0,002X2
przyrost krańcowy X1=0,2 pkX2=0,002
*Elastyczność (zmiany procentowe)*
*współczynnik korelacji =R (wielokrotność R)
(Znak współczynnika korelacji i znak stojący przy b1 są zawsze takie same)
*X;Y-silna KORELACJA*
*MSE tj estymator parametru (zawsze będzie jedno MSE)
Jeżeli usuwamy obserwacje odstajaca: zmniejsza się MSE, zwiększa się R^2.
Składniki:
-resztowe
(średnia tych reszt równa się 0).
-standaryzowane składniki resztowe,
przedział <-3;3>
*Obserwacja odstająca - (King-Kong)
*Testy istotności : do badania całego modelu:
Test F:
H0: R^2=0. HA:R^2>0.
Istotność F-mniejsza od 5%.
do badania parametru:
test t-studenta (służy do badania istotności parametru)
testujemy b0 i b1:
H0:b0=0 HA:b0 różne od zera.
H0:b1=0 HA:b1 różne od zer
*Do wyznaczenia ELASTYCZNOŚCI z równania prognozy regresji liniowej prostej potrzeba:
-średnich lub modalnych ; -średnich lub median*
Prognozowanie w modelu regresji liniowej prostej.Po oszacowaniu metodą najmniejszych kwadratów otrzymujemy
estymatory β 0 , β1 parametrów:
. Wobec tego równanie prognozy ma postać: Y = β0 + β1 X (charakter
β 0 , β1
 
 

deterministyczny)
REGRESJA LINIOW WIELOKROTNA
*3 zmienne ilościowe* zawsze JEDNA zależna(Y) DWIE zmienne niezależne (X)
*Miara dopasowania
R^2 należy<0,1> i dopasowany R^2 (informuje nas że w modelu są jakieś zmienne niezależne X,
które można usunąć). R^2 - R^2 dopasowane <5% (jeśli różnica jest większa, to model zawiera zbyt
dużo zmiennych niezależnych i należy usunąć którąś z modelu i przeliczyć model raz jeszcze z użyciem np. arkusza)
*Istotność zmiennych (parametr)
t-studenta
*Istotność modelu
F
*Ilość parametrów
Y=b0+b1X1+b2X2+...+bNXN+E
Parametrów w regresjach jest tyle ile zmiennych niezależnych (X) dodać dwa
.
*Duża próba co najmniej 15 obserwacji na 1 "X"
*Założenia:
Homoskedastyczność(stałość reszt),
Normalność (kurtoza, skośność[ standaryzowane składniki resztowe ]należą do
przedziału od -1do 1) ,autokorelacja.
*Przyrost krańcowy (przyrost jednostkowy)*
przykład:X=-3,89+0,2X1+0,002X2
przyrost krańcowy X1=0,2 pkX2=0,002
*Elastyczność
Ex1=Pkx1* x1/y ; Ex2=Pkx2*x2/y
*X1;Y- silna korelacja. X2;Y-silna korelacja. X1;X2-słaba korelacja.
*Parametr T (służy do testowania istotności pomiarów)
*Prognozowanie w regresji - nożyce regresji*
A N A L I Z A
W A R I A N C J I
Jeżeli pojawia się porównanie czegoś w regionach, obszarach, liniach
lotniczych to zawsze będzie analiza wariancji.
*2 zmienne. czynnik zawsze będzie jakościowy a np.zarobki to będą replikacje ilościowe
1 zmienna- jakościowa (niezależna) np:region
1 zmienna- ilościowa (zależna) np:zarobki
*W analizie wariancji PORÓWNUJEMY ŚREDNIE
*Test F używany jest do porównywania ze sobą średnich.*
*Jest zawsze tylko jeden czynnik jakościowy.
*Założenia
HOMOSKEDASTYCZNOŚĆ (chroni nas przed błędem)
Są dwie możliwości sprawdzenia:
1.Reguła kciuka - Hartleya:
max.liczba z wariancji
min.liczba z wariancji.
9(zawsze)> max/min.
jeżeli jest mniejsze od 9 to jest homoskedastyczność,
a jeżeli jest większe od 9 to nie ma homoskedastyczności.
LSD- technika PORÓWNANIA WIELOKROTNEGO (pozwala na połączenie bliskich sobie liczb w grupy). Służy
2.TEST BARTLETA
*Hipoteza 0.
p<5% to H0 odrzucamy.
p>5% to H0 nie odrzucamy.
*Korelacja = wielokrotność R
M O D E L
C O B B A - D O U G L A S A
*Zmienne ilościowe
zmienna zależna Q(Produkcja Q)
zmienne niezależne X1,X2,X3,....,Xn
(Maszyny(X1) Energia (X2) Praca(X3) - czynniki produkcji.)
*MODEL LINIOWY (funcja produkcji)
(w modelu liniowym przyrosty krańcowe to elastyczność)
*MODEL POTĘGOWY (funcja produkcji, uogólniona postać funkcji Cobba-Douglasa)
(w modelu potęgowym wykładniki to elastyczność)
Q=b0*X1^b1 * X2^b2 *....* Xk^bk
bo,b1,b2,bk=parametry.
przykład:Q=-0,81*X1 ^ 0,34 * X2 ^0,72
elastyczność: EX1=0,34 (b1)
Odp. jeżeli nakłady czynników produkcji X1(środki trwałe) wzrosną o 1% to
produkcja końcowa(Q) wzrośnie o 0,34%, EX2=0,72 (b2)--jeżeli X2 wzrośnie o 1% to
produkcja końcowa(Q) wzrośnie o 0,72%.
*Operacja zwana logarytmowaniem służy do tego aby obliczyć estymatory parametrów w modelu
Cobba-Douglasa.*
-Popyt: determinanty, produkcja i czynniki produkcji.
-Produkt przeciętny(PP):
przykład: Q=1,68*X1^0,33*X2^0,5
X1=508,1 ;X2=521,1.
PPX1=Q/X1=464,4/508,1=0,91
PPX2=Q/X2=464,4/521,1=0,89
-Przyrost krańcowy:
PKX1=EX1*PPX1=0,33*0,91=0,3(30 gr).
PKX2=EX2*PPX2=0,57*0,89=0,5 (50 gr)
Odp. Produkt przeciętny
-z jednej jednostki czynnika produkcji X1 można było przeciętnie uzyskać 0,91
jednostki produkcji całkowitej.
-jeżeli należność czynnika X1 wzrośnie o 1 jednostkę to produkcja końcowa
wzrośnie o 0,3
*EFEKT SKALI PRODUKCJI (ESP)
przykład: ESP=0,33+0,57=0,90.
ESP=1 to produkcja rośnie tak samo szybko jak nakłady czynników produkcji.
ESP<1 to produkcja rośnie wolniej stopniu niż nakłady produkcji.
ESP>1 to produkcja rośnie szybciej niż nakłady produkcji.
A N A L I Z A
P O P Y T U
Do analizy popytu na dane dobro wykorzystujemy:
modele potęgowe (częściej wykorzystywane, np. 
),
P = 1,2C -2 , 02 C1k, 55 R 2 ,12 R 1k, 23 D1 , 89
modele liniowe (np. 
)
P = -150,14 - 1,54C + 4,36R + 2,13D + 0,89Ck
ELASTYCZNOŚĆ POPYTU -odsetek zmian w popycie wynikający ze zmiany o 1% jednej ze
zmiennych niezależnych (przy założeniu ceteris paribus)
Równanie popytu na maśło Masmix vs Rama—
przykład m.potęgowego: Q=5,0 * C^-0,17 * D^0,15 * Ck^0,30 * R^0,5 * Rk^-0,70
(C-cena ; D-dochód ; Ck-cena konkurenta ; R-reklama ; Rk-reklama konkurenta ; Q-wielkość popytu)
Elastyczność cenowa popytu (zwykła) Ec=-0,17. W jakim stopniu 1% zmiana ceny wpływa na
popyt? Jeżeli cena wzrośnie o 1% to popyt spadnie o 0,17%.
Elastyczność cenowa krzyżowa popytu (mieszana) Eck=0,30 Jeżeli cena dobra konkurenta
wzrośnie o 1% to popyt na nasze dobro wzrośnie o 0,3%.
Elastyczność dochodowa popytu Ed=0,15
Elastyczność popytu względem wydatków na reklamę Er=0,50
Elastyczność popytu względem wydatków konkurencji na reklamę Erk=-0,70
Elastyczność cenowa popytu
Jeżeli Ec<-1 popyt elastyczny.
przykład:Ec=-2,0
Jeżeli cena wzrośnie o 1% to popyt spada o 2%.
Ec należy do przedziału <-1;0> popyt nieelastyczny. przykład:Ec=-0,7
Jeżeli cena wzrośnie o 1% to popyt spadnie o 0,7%
Ec>0 popyt odwrotnie proporcjonalny.
przykład:Ec=0,3
Jeżeli cena wzrasta o 1% to popyt wzrasta o 0,3%.
Ec=0 popyt sztywny. popyt nie reaguje na zmianę ceny.
Trzy przypadki elastyczności cenowej popytu:
popyt elastyczny(Ec<-1) -popyt spada(wzrasta)w większym stopniu niż wzrasta (spada)cena
popyt proporcjonalny (Ec=-1) - popyt spada(wzrasta) w takim samym stopniu jak wzrasta (spada)
cena.
popyt nieelastyczny Ec należy do przedziału <-1;0>
S T A T Y S T Y K I
Kurioza
Skośność
Kwartyl :
O P I S O W E
miara spłaszczenia.
miara symetrii.
dolny=0,25; mediana=0,50 górny=o,75.
przykład:
kwartyl dolny 0,25= 25%<2949 0,25=75%>2949.
kwartyl górny 0,75= 75%<4082 0,75=25%>4082
*Przedział ufności dla średniej:
[X - zα \2 * σ/√n ; X + zα \2 * σ/√n]
(X-średnia, σ-odchylenie standarowe, n-liczba obserwacji,zα \2-w tablicach.)
poziom ufności= 1- α=0,95 ; α=0,05 ; α\2 = 0,025
Jeżeli próbka jest mniejsza niż 30 nie może być rozkład normalny.
Rozkład normalny gdy kurtoza i skośność mieszczą się w przedziale od 1do -1.
do wyznaczania wartości skrajnych (min. lub max.) jak
wskazać np.region o najwyższych zarobkach Metodę LSD można zastosować tylko wtedy jeżeli odrzucamy
Hipotezę 0.
1
Download