Adam Kirpsza Zastosowanie regresji logistycznej w studiach nad Unią Europejska Anna Stankiewicz Izabela Słomska Wstęp- statystyka w politologii • Rzadkie stosowanie narzędzi statystycznych • Pisma Karla Poppera i Imre Lakatosa – wykazanie słabości PROBABILIZMU Probabilizm - doktryna, wg. której poznanie ludzkie nie może osiągnąć absolutnej pewności ze względu na brak rzetelnych kryteriów prawdy, więc człowiek w swojej działalności powinien kierować się "zasadami prawdopodobnymi” Wnioskowanie Statystyczne Estymacja Szacowanie wartości nieznanych rozkładu Weryfikacja hipotez statystycznych Sprawdzanie poprawności przypuszczeń na temat rozkładu Nowe trendy • Dezaktualizacja twierdzeń Poppera i Lakatosa-> „ukwantowienie” nauki o polityce • Kwant – najmniejsza porcja, jaką może mieć lub o jaką może zmienić się dana wielkość fizyczna w pojedynczym zdarzeniu Regresja logistyczna • Jedna z metod statystycznych, za pomocą której można w łatwy sposób weryfikować teorie rozumiane jako zbiór hipotez wraz z określeniem ich mocy predykcyjnej. Weryfikacja hipotez statystycznych • Proces uogólniania wyników badania próby losowej na całą populację • Stawianie przypuszczeń dotyczących rozkładu zmiennych, a następnie sprawdzeniu ich prawidłowości Weryfikacja hipotez • Sformułowanie hipotez badawczych • (hipoteza zerowa i hipoteza alternatywna) • Weryfikacja hipotezy zerowej ( metoda, statystyka testowa, próba losowa) • Wybieramy poziom istotności- α • Obliczenie wartości i wyznaczenie prawdopodobieństwa • Tablice statystyczne – chi- kwadrat • Podejmujemy decyzję o odrzuceniu hipotezy zerowej na rzecz hipotezy alternatywnej lub nie mamy podstaw do odrzucenia hipotezy zerowej • Prawo wyłącznego środka z pary Ho i H1- tylko jedno z nich może być prawdziwe Regresja • Metoda statystyczna badająca zależności między zmiennymi • Regresja liniowa • konstrukcja na wykresie rozrzutu zmiennych X i Y linii prostej, która będzie najlepiej opisywać związek między nimi • • pozwala nam przewidywać wpływ jednej zmiennej na druga • pozwala nam prognozować średnią wartość zmiennej Regresja logistyczna 1) Zmienna o charakterze binarnym - rozkład dychotomiczny: 1- zdarzenie ma miejsce 0- zdarzenie nie ma miejsca 2) Po lewej stornie równania znajduje się P – prawdopodobieństwo Prawdopodobieństwo • ROZUMIANE OGÓLNIE stosunek liczby zdarzeń korzystnych czyli sukcesów do liczby wszystkich prób np.5/11 • PRAWDOPODOBIEŃSTWO SZANSY stosunek prawdopodobieństwa, że dane zdarzenie wystąpi (p) do prawdopodobieństwa , że dane zdarzenie nie wystąpi (q), suma P równa 1 Przykład • Sprzedawca wie, że jedna na pięć ofert sprzedaży jest skuteczna • P- liczba sukcesów • Q- liczba porażek • P= 1/5 = 0,2 • Q= 1 – P = 4/5= 0,8 Regresja logistyczna • Testowanie modelu regresji logistycznej • Testowanie słuszności całej teorii • Testowanie poszczególnych hipotez • Analiza mocy predykcyjnej teorii TESTOWANIE JAKOŚCI DOPASOWANIA CAŁEGO MODELU 1) Test współliniowości • współczynnik korelacji Pearsona 2) Test ilorazu wiarygodności- polega na sprawdzeniu, czy model ze zmiennymi jest lepszy od modelu bez zmiennych. Oblicza się w tym celu dewiancję i bada pod kątem rozkładu chi-kwadrat. 3) Test zbieżności- współczynnik determinacji BADANIA ISTOTNOŚCI STATYSTYCZNEJ PREDYKTORÓW PREDYKTOR - (ang. Predictor) – pojęcie najczęściej używane w psychologii, jego znaczenie można opisać jako obserwację czegoś, co pozwala na wyciągnięcie wniosków i na tej podstawie przewidywanie (prognozowanie) WERYFIKACJA POSZCZEGÓLNYCH HIPOTEZ 1) Test Walda Zw- Test Walda ß- Współczynnik regresji S.E. (Standard error)- Wartość błędu standardowego 2) Iloraz szans gdzie: P(A) – prawdopodobieństwo zajścia zdarzenia (wartość 1 w zmiennej zależnej) w klasie obserwacji A (wartość 1 zmiennej niezależnej); P(B) – prawdopodobieństwo zajścia zdarzenia (wartość 1 w zmiennej zależnej) w klasie obserwacji B (wartość 0 zmiennej niezależnej). TEST MOCY PREDYKCYJNEJ MODELU TABELA KLASYFIKACYJNA – jej istotą jest procentowe określenie trzech wielkości: 1) Trafności (ACC) 2) Czułości (C) 3) Specyficzności (S) TEST MOCY PREDYKCYJNEJ MODELU CD. PRZYKŁAD TABELI KLASYFIKACYJNEJ: TEST MOCY PREDYKCYJNEJ MODELU CD. ANALIZA ROC – polega na konstrukcji krzywej ilustrującej związek między dwoma współczynnikami klasyfikacyjnymi: czułością i specyficznością PRZYKŁAD ZASTOSOWANIA REGRESJI LOGISTYCZNEJ 1) Czego dotyczy badanie? – PROCESU PODEJMOWANIA DECYZJI W RADZIE 2) Pytanie badawcze: Jakie czynniki powodują zaangażowanie się ministrów w pracę na niższych szczeblach? 3) Rozstrzygnięcie: regresja logistyczna PRZYKŁAD ZASTOSOWANIA REGRESJI LOGISTYCZNEJ CD. ETAP 1 1) Postawienie hipotez badawczych 2) Postawienie hipotez zerowych PRZYKŁAD ZASTOSOWANIA REGRESJI LOGISTYCZNEJ CD. ETAP 2 1) Testowanie hipotez zerowych 2) Budowanie predyktorów 3) Obliczenia, mające na celu weryfikację modelu PREDYKTORY 1) Zmienna zależna „zaangażowanie ministrów” wynosi 1, gdy przed przyjęciem danego aktu prawnego w Radzie ministrowie debatowali nad projektem lub przyjęli polityczne porozumienie 2) Zmienna zależna „zaangażowanie ministrów” wynosi 0, gdy dana regulacja nie była przed jej formalnym uchwaleniem przedmiotem debaty lub takiego porozumienia PREDYKTORY 1) Zmienna niezależna „sposób głosowania” wynosi 1, gdy do przyjęcia danego aktu prawnego była wymagana jednomyślność 2) Zmienna niezależna „sposób głosowania” wynosi 0, gdy został on uchwalony w Radzie kwalifikowaną większością PREDYKTORY 1) Zmienna niezależna „procedura legislacyjna” wynosi 1, gdy dany akt prawny został uchwalony w ramach współdecydowania 2) Zmienna niezależna „procedura legislacyjna” wynosi 0, gdy był przyjęty w ramach innej procedury PREDYKTORY 1) Zmienna niezależna „komitologia” wynosi 1, gdy w danym akcie prawnym była zawarta klauzula komitologiczna 2) Zmienna niezależna „komitologia” wynosi 0, gdy takiej klauzuli nie było PREDYKTORY 1) Zmienna niezależna „rozszerzenie” wynosi 1, jeżeli dany akt prawny został uchwalony po 1 maja 2004 2) Zmienna niezależna „rozszerzenie” wynosi 0, gdy został uchwalony przed tą datą OBLICZENIA Przeprowadzenie testów w trzech obszarach: 1) Jakości dopasowania modelu 2) Istotności poszczególnych hipotez 3) Mocy predykcyjnej teorii KONKLUZJE 1) Metody statystyczne jako ciekawe narzędzie analizy rzeczywistości 2) Przyjęcie procedury triangulacyjnej w badaniach nad naukami politycznymi 3) Regresja logistyczna wyjaśnia zjawiska, które już miały miejsce, ale tez prognozuje ich dalszy kształt 4) Regresja logistyczna jako drzwi do wyższych poziomów nauki Anna Stankiewicz Izabela Słomska