Ocena zależności - E-SGH

advertisement
Ocena zależności
Zadanie 1
Na podstawie podanego rozkładu zmiennej losowej dwuwymiarowej (X,Y), proszę:
a) Wyznaczyć wartość c;
b) wyznaczyć rozkłady brzegowe zmiennych;
c) Wyznaczyć parametry rozkładów brzegowych;
d) Wyznaczyć parametry rozkładu łącznego;
e) Wyznaczyć rozkład warunkowy X|Y=3 oraz parametry tego rozkładu.
Y 1
3
5
X
0
0,1
0,1
c
2
0,2
0,1
0
4
0
0,2
0,1
f) Wyznaczyć rozkład warunkowy X|Y=3 oraz parametry tego rozkładu;
g) Co można powiedzieć o zależności stochastycznej badanych cech;
h) Określić siłę zależności korelacyjnej posługując się współczynnikiem korelacji liniowej.
Zadanie 2
Proszę wyznaczyć liczebności rozkładu łącznego, jeżeli wiadomo, że V=0 i liczebności
brzegowe wynoszą odpowiednio:
a) Dla cechy X: 30, 50, 20.
b) Dla cechy Y: 50, 30, 20;
Zadanie 3
Przeprowadzono badanie opinii publicznej dotyczące poparcia dla posłanki Renaty B. oraz
miejsca zamieszkania respondentów. Wyniki kształtowały się następująco:
poparcie popieram
nie
brak
miejsce
popieram
zdania
zamieszkania
miasto
30
80
10
wieś
70
40
20
a) Czy na podstawie powyższych informacji można twierdzić, że istnieje zależność
stochastyczna między miejscem zamieszkania a poparciem dla Renaty B.? Przyjmij
poziom istotności 0,05.
b) Oceń siłę tej zależności w badanej próbie.
Zadanie 4
W 120 osobowej grupie aktywnych zawodowo mieszkańców jednego z województw zbadano
zależność pomiędzy miejscem zamieszkania i posiadaniem samochodu osobowego,
otrzymując następujące wyniki:
Miejsce zamieszkania
posiada
nie posiada
Miasto
25
35
Wieś
35
25
Na poziomie istotności 0,01 zweryfikować hipotezę o niezależności stochastycznej między
badanymi cechami.
1
Zadanie 5
Badając związek miedzy miejscem zamieszkania i wydatkami na rozrywkę i kulturę ( w zł)
uzyskano na podstawie 1000 – elementowej próby losowej następującą postać tablicy
korelacyjnej:
Kategorie cech
Wydatki w zł:
0-20 20-40 40-60
60-80
Wieś
100
20
0
0
Miejscowość o liczbie mieszkańców do 75 000
80
220
100
60
Miejscowość o liczbie mieszkańców powyżej 75 000
0
0
200
220
Określić siłę zależności statystycznej badanych cech. Czy zależność ta jest istotna?
Zadanie 6
Wylosowano grupę 200 osób, a następnie zbadano zależność pomiędzy ich płcią (x), a faktem
posiadania przez nich prawa jazdy (y).Sprawdź hipotezę o stochastycznej niezależności
pomiędzy badanymi zmiennymi, wiedząc, że współczynnik V- Cramera przyjął dla tej próby
wartość 0,2 (przyjąć poziom istotności 0,05).
Zadanie 7 (5.3.1 ze zbioru)
OECD podaje dane dla wybranych krajów o wydatkach na szkolnictwo wyższe oraz
wysokości nakładów na jednego studenta w 2000 roku:
Kraj
Wydatki [%PKB]
Nakłady [$/studenta]
USA
1,1
20358
Szwajcaria
1,2
18450
Szwecja
2,0
15097
Holandia
1,3
11934
Japonia
0,5
10914
Niemcy
1,1
10898
Austria
1,4
10851
Francja
1,0
8373
Włochy
0,8
8065
Polska
0,2
1235
a) Jaka jest kolejność państw w każdym z ciągu danych?
b) Wyznaczyć współczynnik korelacji rang Spearmana i zinterpretować jego wynik.
Zadanie 8
W celu zbadania zależności pomiędzy wysokością płacy a długością stażu w firmie
wylosowano 5 pracowników. Na podstawie poniższych informacji należy stwierdzić czy
zależność taka istnieje oraz wyznaczyć jej siłę i kierunek. Czy na poziomie istotności 0,05
zależność ta jest istotna w populacji pracowników jeżeli rozkład stażu pracy w firmie
i zarobków pracowników mają rozkład normalny?
Staż pracy
1
1,5
2,5
3
2
Płaca
800
2500
2000
3000
1500
2
Zadanie 9
Wysokość kosztów (x) oraz miesięcznych zysków (y) uzyskanych przez firmę w sześciu
wybranych losowo miesiącach (mln USD) przedstawiono w zestawieniu:
x
10
9
7
5
3
2
y
3
7
9
8
12
15
Określ siłę zależności pomiędzy zmiennymi, wiedząc, że sx= 3,22 oraz sy = 4,15. Czy badaną
zależność można uznać za istotnie ujemną (przyjąć α = 0,05) jeżeli miesięczne koszty i zyski
firmy mają rozkład normalny?
Zadanie 10
Zbadano 180 hurtowni ze względu na: x - liczbę zatrudnionych osób i y -wartość sprzedaży
(tys.zł). Uzyskano następujące informacje: ∑xi = 1440; ∑yi = 32,4; ∑xiyi =11000; Sx= 8;
Sy=35. Ocenić siłę zależności wartości sprzedaży względem liczby zatrudnionych. Czy
zależność ta jest istotna na poziomie istotności 0,05? Jakie założenia należy poczynić w celu
sprawdzenia istotności zależności?
Zadanie 11
W oparciu o informacje ustalone dla 100 losowo wybranych studentów, dotyczące liczby
egzaminów w sesji letniej (x) i liczby wizyt w kinie w maju br. zbadaj istotność tego związku
dla ogółu studentów. Przyjąć poziom istotności 0,01. Jeżeli wymaga tego metoda, zapisz
stosowne założenia.
L.wizyt w kinie 0
1
2
L.egzaminów
4
0
20
10
5
20
20
0
6
20
10
0
Zadanie 12
120 losowo wybranych osób zapytano o wydatki (w zł) na prasę w ciągu ostatniego miesiąca
(X) oraz o to, czy w ubiegłym roku przeczytały przynajmniej jedną książkę (Y). Dane zostały
pogrupowane według przedziałów klasowych cechy X : 0–10; 10-20; powyżej 20 oraz cechy
Y: tak; nie. Na podstawie uzyskanych odpowiedzi wyznaczono współczynnik V-Cramera
=0,28.
a) Czy związek miedzy zmiennymi można uznać za statystycznie istotny (dla α=0,01)?
b) Uzasadnić, czy charakter cech X i Y pozwala wykorzystać do oceny siły zależności
współczynnik korelacji liniowej Pearsona r ?
Dodatkowe zadania do rozwiązania w domu:
Zbiór zadań:
▪ dwuwymiarowa zmienna losowa:1.3.2-1.3.4; 1.3.1, 1.3.5, 1.3.6.
▪ ocena zależności w rozkładach empirycznych: 5.2 (przykład); 5.2.2; 5.2.4; 5.3.1;
5.3.3; 5.3.5; 5.3.6; 5.5.1
Zestaw dr Wieczorek: 1-7, 12-18, 19 bez b).
3
Download