Zastosowanie regresji logistycznej w studiach nad Unią

advertisement
Adam Kirpsza
Zastosowanie regresji
logistycznej w studiach
nad Unią Europejska
Anna Stankiewicz
Izabela Słomska
Wstęp- statystyka w politologii
• Rzadkie stosowanie narzędzi statystycznych
• Pisma Karla Poppera i Imre Lakatosa – wykazanie
słabości PROBABILIZMU
Probabilizm - doktryna, wg. której poznanie ludzkie
nie może osiągnąć absolutnej pewności ze względu
na brak rzetelnych kryteriów prawdy, więc człowiek
w swojej działalności powinien kierować się
"zasadami prawdopodobnymi”
Wnioskowanie
Statystyczne
Estymacja
Szacowanie wartości
nieznanych rozkładu
Weryfikacja
hipotez
statystycznych
Sprawdzanie poprawności
przypuszczeń na temat
rozkładu
Nowe trendy
• Dezaktualizacja twierdzeń Poppera i Lakatosa->
„ukwantowienie” nauki o polityce
• Kwant – najmniejsza porcja, jaką może mieć lub o
jaką może zmienić się dana wielkość fizyczna w
pojedynczym zdarzeniu
Regresja logistyczna
• Jedna z metod statystycznych, za pomocą
której można w łatwy sposób weryfikować
teorie rozumiane jako zbiór hipotez wraz z
określeniem ich mocy predykcyjnej.
Weryfikacja hipotez statystycznych
• Proces uogólniania wyników badania próby
losowej na całą populację
• Stawianie przypuszczeń dotyczących rozkładu
zmiennych, a następnie sprawdzeniu ich
prawidłowości
Weryfikacja hipotez
• Sformułowanie hipotez badawczych
• (hipoteza zerowa i hipoteza alternatywna)
• Weryfikacja hipotezy zerowej ( metoda, statystyka testowa,
próba losowa)
• Wybieramy poziom istotności- α
• Obliczenie wartości i wyznaczenie prawdopodobieństwa
• Tablice statystyczne – chi- kwadrat
• Podejmujemy decyzję o odrzuceniu hipotezy
zerowej na rzecz hipotezy alternatywnej lub nie
mamy podstaw do odrzucenia hipotezy zerowej
• Prawo wyłącznego środka z pary Ho i H1- tylko
jedno z nich może być prawdziwe
Regresja
• Metoda statystyczna badająca
zależności między zmiennymi
•
Regresja liniowa
• konstrukcja na wykresie rozrzutu
zmiennych X i Y linii prostej, która będzie
najlepiej opisywać związek między nimi
•
• pozwala nam przewidywać wpływ jednej
zmiennej na druga
• pozwala nam prognozować średnią
wartość zmiennej
Regresja logistyczna
1) Zmienna o charakterze binarnym - rozkład
dychotomiczny:
1- zdarzenie ma miejsce
0- zdarzenie nie ma miejsca
2) Po lewej stornie równania znajduje się P –
prawdopodobieństwo
Prawdopodobieństwo
• ROZUMIANE OGÓLNIE
stosunek liczby zdarzeń korzystnych czyli
sukcesów do liczby wszystkich prób
np.5/11
• PRAWDOPODOBIEŃSTWO SZANSY
stosunek prawdopodobieństwa, że dane zdarzenie
wystąpi (p) do prawdopodobieństwa , że dane
zdarzenie nie wystąpi (q), suma P równa 1
Przykład
• Sprzedawca wie, że jedna na pięć ofert sprzedaży
jest skuteczna
• P- liczba sukcesów
• Q- liczba porażek
• P= 1/5 = 0,2
• Q= 1 – P = 4/5= 0,8
Regresja logistyczna
•
Testowanie modelu regresji
logistycznej
• Testowanie słuszności całej teorii
• Testowanie poszczególnych hipotez
• Analiza mocy predykcyjnej teorii
TESTOWANIE JAKOŚCI DOPASOWANIA
CAŁEGO MODELU
1) Test współliniowości
• współczynnik korelacji Pearsona
2) Test ilorazu wiarygodności- polega na
sprawdzeniu, czy model ze zmiennymi jest
lepszy od modelu bez zmiennych. Oblicza się w
tym celu dewiancję i bada pod kątem rozkładu
chi-kwadrat.
3) Test zbieżności- współczynnik determinacji
BADANIA ISTOTNOŚCI
STATYSTYCZNEJ PREDYKTORÓW
PREDYKTOR - (ang. Predictor) – pojęcie
najczęściej używane w psychologii, jego
znaczenie można opisać jako obserwację
czegoś, co pozwala na wyciągnięcie
wniosków i na tej podstawie
przewidywanie (prognozowanie)
WERYFIKACJA POSZCZEGÓLNYCH
HIPOTEZ
1) Test Walda
Zw- Test Walda
ß- Współczynnik regresji
S.E. (Standard error)- Wartość błędu
standardowego
2) Iloraz szans
gdzie:
P(A) – prawdopodobieństwo zajścia zdarzenia (wartość 1 w zmiennej zależnej)
w klasie obserwacji A (wartość 1 zmiennej niezależnej);
P(B) – prawdopodobieństwo zajścia zdarzenia (wartość 1 w zmiennej zależnej)
w klasie obserwacji B (wartość 0 zmiennej niezależnej).
TEST MOCY PREDYKCYJNEJ
MODELU
TABELA KLASYFIKACYJNA – jej istotą jest
procentowe określenie trzech wielkości:
1) Trafności (ACC)
2) Czułości (C)
3) Specyficzności (S)
TEST MOCY PREDYKCYJNEJ
MODELU CD.
PRZYKŁAD TABELI KLASYFIKACYJNEJ:
TEST MOCY PREDYKCYJNEJ
MODELU CD.
ANALIZA ROC – polega
na konstrukcji krzywej
ilustrującej związek
między dwoma
współczynnikami
klasyfikacyjnymi:
czułością i
specyficznością
PRZYKŁAD ZASTOSOWANIA
REGRESJI LOGISTYCZNEJ
1) Czego dotyczy badanie? – PROCESU PODEJMOWANIA
DECYZJI W RADZIE
2) Pytanie badawcze: Jakie czynniki powodują zaangażowanie
się ministrów w pracę na niższych szczeblach?
3) Rozstrzygnięcie: regresja logistyczna
PRZYKŁAD ZASTOSOWANIA
REGRESJI LOGISTYCZNEJ CD.
ETAP 1
1) Postawienie hipotez badawczych
2) Postawienie hipotez zerowych
PRZYKŁAD ZASTOSOWANIA
REGRESJI LOGISTYCZNEJ CD.
ETAP 2
1) Testowanie hipotez zerowych
2) Budowanie predyktorów
3) Obliczenia, mające na celu weryfikację modelu
PREDYKTORY
1) Zmienna zależna „zaangażowanie ministrów”
wynosi 1, gdy przed przyjęciem danego aktu
prawnego w Radzie ministrowie debatowali
nad projektem lub przyjęli polityczne
porozumienie
2) Zmienna zależna „zaangażowanie ministrów”
wynosi 0, gdy dana regulacja nie była przed jej
formalnym uchwaleniem przedmiotem debaty
lub takiego porozumienia
PREDYKTORY
1) Zmienna niezależna „sposób głosowania”
wynosi 1, gdy do przyjęcia danego aktu
prawnego była wymagana jednomyślność
2) Zmienna niezależna „sposób głosowania”
wynosi 0, gdy został on uchwalony w Radzie
kwalifikowaną większością
PREDYKTORY
1) Zmienna niezależna „procedura legislacyjna”
wynosi 1, gdy dany akt prawny został
uchwalony w ramach współdecydowania
2) Zmienna niezależna „procedura legislacyjna”
wynosi 0, gdy był przyjęty w ramach innej
procedury
PREDYKTORY
1) Zmienna niezależna „komitologia” wynosi 1,
gdy w danym akcie prawnym była zawarta
klauzula komitologiczna
2) Zmienna niezależna „komitologia” wynosi 0,
gdy takiej klauzuli nie było
PREDYKTORY
1) Zmienna niezależna „rozszerzenie” wynosi 1,
jeżeli dany akt prawny został uchwalony po 1
maja 2004
2) Zmienna niezależna „rozszerzenie” wynosi 0,
gdy został uchwalony przed tą datą
OBLICZENIA
Przeprowadzenie testów w trzech obszarach:
1) Jakości dopasowania modelu
2) Istotności poszczególnych hipotez
3) Mocy predykcyjnej teorii
KONKLUZJE
1) Metody statystyczne jako ciekawe narzędzie
analizy rzeczywistości
2) Przyjęcie procedury triangulacyjnej w
badaniach nad naukami politycznymi
3) Regresja logistyczna wyjaśnia zjawiska, które
już miały miejsce, ale tez prognozuje ich dalszy
kształt
4) Regresja logistyczna jako drzwi do wyższych
poziomów nauki
Anna Stankiewicz
Izabela Słomska
Download