4. Metody skalowania postaw. 1. Konstruowanie pytań w kwestionariuszu wywiadu W tworzeniu pytań kwestionariuszowych należy podjąć 4 podstawowe decyzje dotyczące: - rodzaju poszukiwanych informacji, - treści pytań kwestionariuszowych, - formy odpowiedzi na pytania, - stylu i formy gramatycznej pytania. 1.1. Rodzaj poszukiwanych informacji Pytania w kwestionariuszu powinny dostarczyć informacji pozwalających na rozwiązanie problemu badawczego. Przed zamieszczeniem danego pytania w kwestionariuszu należy zastanowić się, w jaki sposób informacje uzyskane w odpowiedzi na zadane pytanie będą wykorzystane przy analizie danych i jaka będzie ich rola w rozwiązaniu problemu badawczego. 1.2. Określenie treści pytań Pytania mogą dotyczyć zachowań, postaw i cech respondenta (metryczkowe). Pytania dotyczące zachowań Służące do ustalenia wielkości rynku: „Czy w ogóle kupuje Pan(i) ...?” „Jak często kupuje Pan(i) ...?” „Ile kupuje Pan(i) ...?” „Ile wydał(a) Pani(i) w ciągu ostatniego miesiąca na ...?” Służące do ustalenia udziału w rynku firm lub produktów: „Jakiej marki wyrobu Pan(i) używa” „Jaką ilość produktu (określonej marki) kupuje Pan(i) miesięcznie?” Służące określeniu schematu zakupów klientów: „Jak często kupuje Pan(i) ...?” „Kiedy ostatnio kupił(a) Pan(i) ...?” „Ile zwykle kupuje Pan(i) ...?” Plan : 1. Konstrukcja pytań w kwestionariuszu wywiadu. 2. Poziomy pomiaru (skale pomiarowe). 3. Podstawowe zasady skalowania postaw. Do określenia stanu posiadania: „Czy posiada Pan(i) dany produkt” „Jak długo go Pan(i) ma?” „Ile posiada Pan(i) takich produktów?” Do określenia wzorów zachowań: „Jak często kupuje (odwiedza, używa) Pan(i) ...?” „Kto pomógł Panu(i) w wyborze zakupionego ...?” „Kto w Pana(i) firmie podejmuje ostateczne decyzje o wyborze określonego dostawcy?” Do przewidywania zamierzeń: „Czy zamierza Pan(i) zakupić (odwiedzić, skorzystać) ... w ciągu najbliższych sześciu miesięcy?” „Załóżmy, że Pana(i) wydatki w tym roku wynosiły 100 – jakie przewiduje Pan(i) za dwa lata?” „Dlaczego uważa P. że w przeszłości będzie P. mniej kupować? [] Sam, [] Z małżonkiem, [] Z dziećmi, 3.Skala Likerta: pytanie, które daje możliwość określenia stopnia akceptacji danego stwierdzenia "Czy małe linie lotnicze zapewniają wyższy poziom usług niż duże?" 1[] Całkowicie się nie zgadzam, 2[] Nie zgadzam się, 3[] Nie mam opinii, 4[]Zgadzam się, 5[] Całkowicie się zgadzam Pytania dotyczące postaw Ustalanie przyczyn konkretnych zachowań, takich jak zakupy: „Dlaczego kupuje Pan(i) produkty tej marki?” „Jakie czynniki mają Pana(i) zdaniem największy wpływ na wybór marki?” 4.Skala zróżnicowania semantycznego: skala zawarta między dwoma skrajnymi wyrazami. Respondent wybiera punkt, który najlepiej przedstawia jego pogląd PLL LOT : Olbrzymie __________ Małe Nowoczesne_________Przestarzałe Ustalanie popytu nie zaspokojonego: „Czy kupiony ostatnio .... spełnia Pana(i) wcześniejsze oczekiwania?” „Jakie cechy powinien posiadać poszukiwany przez Pana(nią) ...?” „Ile był(a)by Pan(i) skłonny(a) zapłacić za ...?” 5.Skala ważności: skala szeregująca pewne atrybuty od "w ogóle nie istotne" do "bardzo istotne" "Jedzenie na pokładzie samolotu jest dla mnie: 1[] B. istotne, 2[] Istotne , 3[] Dość istotne, 4[] Niezbyt istotne 5[]Zupełnie nieistotne Ujawnianie postaw w stosunku do określonych produktów: „Co myśli Pan(i) o ...?” „Jaka marka ... jest najlepsza?” 6. Skala ocen: skala, która szereguje pewne atrybuty od "zły" do "znakomity' "Jedzenie w samolotach LOT jest: 1[] Znakomite , 2[] B. dobre , 3[] Dość dobre, 4[] Zadowalające , 5[] Złe Przed sformułowaniem pytania należy zastanowić się, czy treść pytania odpowiada zapotrzebowaniu informacyjnemu badacza. Wymagania dotyczące treści pytania: - Każde pytanie powinno dotyczyć jednego problemu, - Być łatwe do odpowiedzi dla respondenta. (Trzeba wziąć pod uwagę, że respondent może nie mieć wiedzy potrzebnej do udzielenia odpowiedzi, zapomnieć o faktach ze względu na upływający czas, mieć trudności w udzieleniu odpowiedzi na pytanie). 7. Skala intencji zakupu: skala opisująca intencje zakupu respondenta "Jeśli istniałaby możliwość korzystania z telefonu podczas długich lotów to: 1[] Z pewnością bym korzystał, 2[] Prawdopodobnie bym korzystał, 3[] Nie wiem czy bym korzystał, 4[] Prawdopodobnie bym nie korzystał, 5[] Z pewnością bym nie korzystał Oprócz pytań potrzebnych do rozwiązania problemu badawczego wyróżniamy pytania neutralne: wprowadzające, buforowe, sprawdzające, filtrujące. 1.3. Określenie form odpowiedzi na pytanie Najbardziej podstawowym rozróżnieniem pytań ze względu na formę, są pytania: - „otwarte” - pozostawiające respondentowi pełną swobodę wypowiedzi, - „zamknięte”- podające zestaw odpowiedzi do wyboru. W każdym przypadku trzeba rozstrzygnąć, jaka forma jest najwłaściwsza dla określonego pytania. Rodzaje pytań zamkniętych 1.Dychotomiczne: pytania z dwoma możliwymi odpowiedziami (tak, nie) "Czy podróżując samolotem chciałbyś mieć do dyspozycji telefon?" 2.Wyboru wielokrotnego: pytania z trzema lub więcej możliwościami odpowiedzi "Z kim odbywasz tę podróż samolotem : 1.4. Określenie formy gramatycznej i stylistycznej pytania Po opracowaniu problematyki, treści i formy odpowiedzi – należy pytanie opracować stylistycznie i gramatycznie. Źle opracowane stylistycznie pytanie może doprowadzić do nieporozumień. Formułując pytanie należy określić: - czy dane słowo znaczy to, co badacz chce, aby znaczyło, - czy dane słowo ma jakieś inne znaczenia ? - czy kontekst pytania wskazuje jednoznacznie na jego znaczenie ? - czy istnieje prostsze określenie, opisujące znaczenie danego pojęcia ? - czy pytanie nie jest drażliwe - czy pytanie nie jest sugerujące ? 1.5. Sprawdzanie kwestionariusza i badania pilotażowe Pytania stosowane przy sprawdzaniu pytań pod kątem ich merytorycznej i formalnej poprawności: 1. Dlaczego to pytanie znalazło się w ankiecie? 2. Dlaczego pytanie jest tak sformułowane? 3. Dlaczego pytanie jest zamieszczone w tym miejscu? 4. Czego pytanie dotyczy? 5. Jakie mogą być odpowiedzi na pytanie? 6. Jak będzie analizowana odpowiedź na pytanie? 7. Czy każde pytanie dotyczy jednego problemu? 8. Czy pytanie nie jest sugerujące? 9. Czy pytanie jest trafne? 10. Czy na każde pytanie można odpowiedzieć „tu i teraz”? 2. Poziomy pomiaru (skale pomiarowe) Przedmiotem pomiaru (obiektem) - są cechy osób, rzeczy, stanów, czy zdarzeń (a ściślej - co myśli się o obiekcie pomiaru, odpowiadając na pytanie, jaki on jest). Pomiar polega na przyporządkowaniu określonych symboli cechom mierzonych obiektów. Poziomy pomiaru Skale pomiarowe buduje się przyporządkowując symbole mierzonym cechom wg określonych zasad. Czynność odwzorowania mierzonej cechy za pomocą wybranej skali nazywa się skalowaniem. W zależności od rodzaju symboli (liczby, znaki, nazwy) i sposobu ich przyporządkowania mierzonym cechom wyróżnia się 4 poziomy pomiaru. Poziomy są wyznaczone przez zastosowane skale w kwestionariuszu wywiadu (czy ankiecie): nominalną, porządkową, przedziałową i stosunkową (ilorazową). Skale pomiarowe: niemetryczne (nominalna i porządkowa), metryczne (przedziałowa i stosunkowa). Skala nominalna – cechuje się najniższym poziomem pomiaru. Skala nominalna jest zbiorem kategorii jakościowych, który umożliwia zupełną i rozłączną klasyfikację zbioru wyników. Podstawową operacją pomiarową jest operacja identyfikacji kategorii, do której należy zaliczyć dany wynik, co prowadzi do podziału zbioru wyników na rozłączne podzbiory (różniące się między sobą). Do zmiennych znajdujących się na tym poziomie pomiaru można zaliczyć płeć, miejsce zamieszkania, cechy produktów, a przykładami skal nominalnych, mogących służyć do identyfikacji wskaźników postaw, są odpowiedzi na skalach pozycyjnych. W badaniach sondażowych niezwykle przydatne jest skalowanie nominalne. Gdy badacza interesuje występowanie jakiejś cechy w badanym obiekcie stosuje on często skalowanie zero-jedynkowe. Jeżeli dana cecha występuje, odpowiednia zmienna przyjmuje wartość 1, w przypadku przeciwnym 0. Skala porządkowa. Przyporządkowanie liczb badanym własnościom odpowiada nie tylko relacjom równości lub różności, lecz również ich uporządkowania ze względu na tę własność. Ponieważ przyporządkowane liczby mają jedynie znaczenie względne (liczba większa oznacza, że własność jej odpowiadająca występuje w większym nasileniu, niż w przypadku własności oznaczonej mniejszą liczbą, nie wiadomo jednak o ile większym). Przykłady skal porządkowych i właściwości, które można mierzyć za pomocą tych skal: wykształcenie, klasa społeczna; status zawodowy, jakość produktów, preferencje. Skale stopniowe są zbudowane w ten sposób, że - są podzielone na kilka stopni w formie przedziałów. Skale ciągłe nie mają wyodrębnionych stopni. Skalą porządkową jest skala rang. Respondent porządkuje cechy umieszczone w kwestionariuszu wg podanego kryterium. Do analizy danych otrzymanych z pomiaru porządkowego można stosować dominantę i medianę, ale nie można obliczyć żadnej średniej. Narzędziami służącymi do weryfikacji hipotez związanych z pomiarem nominalnym i porządkowym są statystyczne testy nieparametryczne. Dominanta – wartość najczęściej spotykana (zw. też wartością modalną). Mediana – wartość cechy, jaką ma środkowa jednostka uporządkowanej zbiorowości statystycznej. Medianę z szeregu rozdzielczego punktowego wyznacza się przez wskazanie jednostki środkowej i odczytanie kategorii odpowiadającej tej jednostce. Przykład zastosowania skali porządkowej: Jak często czytuje Pan(i) poszczególne Stale Bardzo rubryki czasopisma X? często Vademecum Menedżera Kurs Biznesu Często Czasami Nigdy Skala przedziałowa (interwałowa). Ma charakter metryczny, określone są w niej bowiem odległości między wyznaczonymi punktami (wielkości przedziałów), a jednakowym różnicom między stopniami własności badanych obiektów odpowiadają jednakowe różnice między przyporządkowanymi im liczbami. Ponieważ jednostki skali są dowolnie określone, skala ta ma również odgórnie ustalony „punkt zerowy”. (Skala przedziałowa zostaje określona przez wskazanie stałej jednostki miary i przyjęcie umownego punktu zerowego). Pomiar oznacza możliwość rangowania obiektów pod względem nasilenia występowania jakiejś cechy, jak również określenia odległości między obiektami. Do tego poziomu pomiaru należy m.in. skala temperatur Celsjusza, daty kalendarza, indeksy cen. Przykład cechowania kwestionariusza wg skali przedziałowej: P.1. W którym roku zamierza Pan(i) zastąpić swój dotychczasowy samochód nowym modelem? 1997 1998 1999 ….. Nie wiem Zdarza się w badaniach marketingowych, że traktuje się skale porządkowe jako przedziałowe, czyli próbuje się mierzyć cechy , które nie mają jednostki miary. Przy konstrukcji tych skal zakłada się, że różnice między sąsiednimi klasami są równe. 1 2 3 4 5 Skala stosunkowa (proporcjonalna, ilorazowa). Skala ilorazowa określona zostaje przez wybór stałej jednostki miary i wykazanie zera bezwzględnego (jednostronnego ograniczenia zakresu skali). Punkt zerowy na skali stosunkowej oznacza brak (fizyczny poziom zerowy) danej cechy. Na skali stosunkowej mierzy się: wiek, dochody, upływający czas, wielkość sprzedaży, ceny towarów, wielkość popytu na dany towar, koszty, zapasy, liczbę konsumentów, a także postawy nabywców, jeśli cechy te najpierw podlegały standaryzacji (sprowadzeniu do porównywalności. Wyniki obserwacji wyrażone na skali ilorazowej można przekształcić i przedstawić na skali interwałowej, porządkowej lub nominalnej. Jednak przekształcenie i przedstawienie wyników obserwacji na skali niższego rzędu zawsze prowadzi do utraty informacji. Nie można dokonać odwrotnej transformacji. Przykład cechowania kwestionariusza wg skali stosunkowej: „Jaki procent dochodu przeznacza Pan(-i) w skali rocznej na: Wyszczególnienie Żywność Odzież, obuwie 0-5 610 11-20 2130 3140 x 41-50 51-60 61-70 P.: Jak ocenisz szybkość obsługi klientów w sklepie X? 1 Bardzo szybka, 2 Szybka, 3 Ani szybka, ani powolna, 4 Powolna, 5 Bardzo powolna. b/- skalowanie niezrównoważone, skala przedziałowa 1 Ani razu, 2 1raz, 3 2-4razy, 4 5-9razy, 5 10-19razy, 6 20 i więcej razy. Forma skali. Kategorie danej skali mogą być opisane werbalnie, numerycznie (liczbowo), graficznie lub w sposób kombinowany. Przykład: P.: Jak określisz stopień zadowolenia z komfortu jazdy Twoim samochodem? A/- graficzna (obrazkowa), porządkowa forma skalowania: B/- z opisem werbalnym (porządkowa): 1 Bardzo niezadowolony, 2 Niezadowolony, 3 Ani zadowolony, ani niezadowolony, 4 Zadowolony, 5 Bardzo zadowolony. C/- graficzna, z opisem liczbowym (przedziałowa) -20 0 20 D/-graficzna, z opisem liczbowym i werbalnym (ilorazowa) 71-80 8190 91100 x 3. Podstawowe zasady skalowania Skalowanie zrównoważone i niezrównoważone. Skalowanie zrównoważone wymaga ustalenia klasy środkowej oraz wyznaczenia jednakowej liczby klas (przedziałów) o jednakowej intensywności po obu stronach ustalonej klasy środkowej. Jeżeli po obu stronach skali występuje różna liczba klas lub klasy o niejednakowej intensywności albo różnych jednostkach miary, to takie skalowanie nazywa się skalowaniem niezrównoważonym. Przy projektowaniu kwestionariusza należy dążyć do zrównoważonego skalowania odpowiedzi. Nie zawsze jednak możliwe odpowiedzi dają się wyskalować w sposób zrównoważony. Dotyczy to m.in. prób z populacji nieskończonych lub częściowo nieznanych, skalowania wieku (zwłaszcza górnych i dolnych jego przedziałów). Przykłady zrównoważonego i niezrównoważonego skalowania odpowiedzi: a/- skalowanie zrównoważone (skala porządkowa): Jestem zupełnie niezadowolony Jestem całkowicie zadowolony 0% 100% Liczba kategorii skali. Liczba kategorii między biegunami skali zależy od postawy respondenta, formy pomiaru i metody analizy danych. Niekiedy wystarcza zastosowanie skali nominalnej alternatywnej. Czasem trzeba zastosować 10 i więcej kategorii. Jeżeli badacz zadowoli się ogólnymi danymi, może stosować 3 kategorie. Jeżeli pragnie dowiedzieć się więcej na temat postaw, powinien zastosować 5 lub 7 kategorii. Parzysta lub nieparzysta liczba kategorii. Wybór tej liczby przesądza o tym, czy skala będzie zawierała środkową, neutralną pozycję. Zwolennicy stosowania parzystej liczby kategorii argumentują to tym, że postawy nie mogą być neutralne Skalowanie wymuszające i nie wymuszające. Skalowanie wymuszające ma na celu wskazanie przez respondenta ściśle określonej kategorii na skali odpowiedzi. W przypadku, gdy respondent nie jest w stanie wyrazić swojej postawy, stosuje się skalowanie nie wymuszające, umożliwiające respondentowi zajęcie stanowiska neutralnego (wprowadza się możliwość odpowiedzi „nie wiem”).. Dla pojedynczego respondenta jest to np. macierz: 3. Badanie postaw nabywców - metody skalowania postaw Postawa – to pozytywne lub negatywne ustosunkowanie się do pewnego przedmiotu, pojęcia lub sytuacji, jak również gotowość do reagowania w pewien z góry określony sposób na te (lub związane z nimi) przedmioty, pojęcia lub sytuacje. Pomiar postaw, daje odpowiedź na pytanie o przyczyny określonego zachowania i ma znaczenie diagnostyczne. 3.1. Jednowymiarowe skale do pomiaru postaw Wszystkie jednowymiarowe skale postaw można podzielić na: - proste (pojedyncze) - odzwierciedlają wartości nadawane przez respondentów pojedynczym cechom badanych obiektów, - złożone - składają się z kilku skal pojedynczych. Proste skale postaw. Do skal prostych zaliczamy: skalę ważności, ocen, semantyczną, Likerta, skalę rang, metodę porównywania parami, skalę sumowanych ocen. Skala rang - powstaje, gdy respondent porządkuje wymienione w kwestionariuszu kategorie wg podanego kryterium. W kwestionariuszu odpowiedź jest wyskalowana wg skali nominalnej. W wyniku ocen respondenta skala nominalna zmienia się w skalę rang, która jest skalą porządkową. Skale rang są często stosowane w pomiarach preferencji; są łatwe i zrozumiałe dla respondenta. Przykład: Skąd czerpał Pan(i) informacje o pojawieniu się na rynku telewizora A? (Proszę podać kolejność docierania informacji) znajomi wystawa sklepowa rodzina ulotka przysłana do sklepu reklama telewizyjna plakat reklama prasowa akwizytor reklama radiowa jakieś inne źródło Wadą tych skal jest ich malejąca efektywność w miarę wzrostu liczby ocenianych cech. W przypadku dużej liczby ocenianych cech lepiej jest zastosować porównywanie parami. Metoda porównywania parami - jest nie tylko metodą pomiaru, dzięki niej można również analizować zebrane dane na temat postaw. Pomiar polega na tym, że respondent wybiera jedną z dwóch możliwości zgodnie z podanym kryterium. Skale alternatywne są zwykle zestawem par kilku cech (lub produktów), w stosunku do których respondent przyjmuje określone postawy. Respondent dokonuje serii ocen (porównań), np. A smakuje bardziej niż B, D jest tańsze niż C. Respondent daje tyle ocen, ile jest możliwych par. Wyniki porównywania obiektów parami zestawia się w postaci macierzy o wymiarach n x n. A B C D E A 0 0 1 1 B 1 1 1 1 C 1 0 0 1 D 0 0 1 0 E 0 0 0 1 - Jedynka w kolumnie oznacza dominację tego obiektu nad obiektem będącym w wierszu, a zero w kolumnie oznacza dominację obiektu będącego w wierszu nad obiektem będącym w kolumnie. Wyniki uzyskane od wszystkich respondentów podlegają agregacji i zestawia się je w macierz n x n, w której elementy k-tej kolumny (i-tego wiersza) oznaczają odsetek lub liczbę respondentów wskazujących dominację obiektu k-tego (i-tego) nad obiektem i-tym (k-tym). Przykład: Badano preferencje w zakresie 5 marek czekolad w panelu liczącym 100 gospodarstw. Każde gospodarstwo dostało pełny zestaw marek, które należało skosztować i porównać parami. Zbiorcze wyniki w formie wskaźników proporcji przedstawia tabela 1. Tabela 1: Wyniki porównywania parami 5 czekolad ze względu na ich twardość: A B C D E Średnia A 0,11 0,26 0,91 0,70 0,495 B 0,89 0,71 0,97 0,74 0,827 C 0,74 0,29 0,85 0,66 0,635 D 0,09 0,03 0,15 0,48 0,187 E 0,30 0,26 0,34 0,52 0,355 Na przecięciach wierszy i kolumn wpisuje się proporcje odpowiedzi wskazujących na preferowanie marki w danej kolumnie nad marką w danym wierszu. W ten sposób uzyskuje się tablicę quasi-symetryczną z zerami na głównej przekątnej i wskaźnikami proporcji po obu stronach przekątnej, dopełniającymi się symetrycznie do jedności. Na podstawie średnich wartości z kolumn tej macierzy otrzymujemy uszeregowanie czekolad wg twardości. Czekolada B została uznana przez respondentów za najbardziej twardą. Do ilościowej analizy otrzymanych danych jest stosowana najczęściej metoda ocen porównawczych Thurstone’a. Graficzną prezentacją wyników analizy jest skala Thurstone’a, która jest skalą przedziałową. Skala rangowa sumowanych ocen. Przykład cechowania kwestionariusza za pomocą rangowej skali sumowanych ocen P.: Proszę podzielić 100 punktów między wymienione niżej cechy samochodu Polonez, tak aby podział punktów odzwierciedlał to, w jakim stopniu ważna jest dla Pana(i) każda cecha. Wygląd zewnętrzny___________ ____ Komfort ___________________ ____ Status społeczny ____________ ____ Cena _____________________ ____ Bezpieczeństwo ____________ ____ Szybkość __________________ ____ Razem ______________________ _100_ Średnie wartości wyników pomiarów obliczone dla każdego przedziału rangowej skali sumowanych ocen dają również przybliżoną skalę rangową. Zaletą rangowej skali jest prosta analiza danych. Złożone skale postaw Do najczęściej stosowanych zalicza się skale: pozycyjną, semantyczną, Stapela oraz Likerta. Skala pozycyjna (nominalno – porządkowa) - składa się z wielu pojedynczych wyrazów lub fraz uporządkowanych dowolnie, które są oceniane przez respondentów za pomocą jednakowych skal porządkowych.. Pomiar polega na tym, że respondent ocenia zgodnie ze swoimi preferencjami każdą pozycję skali nominalnej określającej cechy danego obiektu, zwykle produktu. Oceny tej dokonuje za pomocą skali porządkowej dołączonej do każdej pozycji skali nominalnej. X Analiza danych (uzyskanych z pomiaru za pomocą skali pozycyjnej) polega na poklasyfikowaniu i zliczeniu zebranych danych, a następnie zaprezentowaniu ich w postaci szeregów statystycznych. Dalszą analizę ilościową można przeprowadzić przy użyciu metody profilowej (omówiona niżej). Skala semantyczna. (zróżnicowania słownego) - jest zestawem kilku lub kilkunastu pojedynczych skal porządkowych - semantycznych). Pomiar. Konstrukcja tej skali rozpoczyna się od określenia przedmiotu oceny, tj. obiektu badania, którym może być np. firma, produkt, sklep, reklama. Następnie badacz określa zestaw cech opisujących obiekt badania, mierzonych na skali porządkowej (zazwyczaj siedmiostopniowej) dla których określone zostają krańce skal w postaci wyrazów mających znaczenie przeciwstawne. Przykład cechowania kwestionariusza za pomocą złożonej skali semantycznej P.: Proszę zaznaczyć swoje oceny cech samochodu Ford Mondeo (każda skala reprezentuje jedną cechę o siedmiostopniowej intensywności) Drogi Tani X Zwykły Luksusowy X Mały Duży Zbieranie i redukcja danych . Po otrzymaniu wszystkich odpowiedzi od respondentów przyporządkowujemy wyróżnionym kategoriom liczby 7,6,5,4,3,2,1 (lub +3,+2,+1,0,-1,-2,-3). Następnie dokonujemy agregacji wyników dla każdej skali porządkowej osobno i zestawiamy je w postaci szeregów statystycznych punktowych. Szereg statystyczny punktowy postaw 75 respondentów wobec np. szybkości Forda (ocena wg 7-stopniowej skali): Kategoria 1 2 3 4 5 6 7 Przykład cechowania kwestionariusza za pomocą skali pozycyjnej P.: Jak często są prowadzone w Pana(i) firmie badania w niżej wymienionych zakresach? Stale B. często Często Czasami Nigdy Potrzeby nabywców Konkurencja Własny produkt Ceny Wolny X Szybki Wartości skumulowane 5 14 33 51 62 69 75 Liczba obserwacji 5 9 19 18 11 7 6 Wyznaczenie mediany sprowadza się w tym przypadku do wskazania jednostki środkowej ( n 1 75 1 38 ) i odczytania kategorii cechy odpowiadającej tej 2 2 jednostce. Dla cechy „szybkość” medianą jest kategoria 4. Dla danych z poszczególnych skal porządkowych wyznaczamy medianę. Tak otrzymane wyniki mogą być analizowane za pomocą tzw. metody profilowej. Przykład: analiza profilowa dla dwóch samochodów „F” i „H”, ustalona na podstawie odpowiedzi 75 respondentów: 7 6 5 4 3 2 1 Szybki Wolny Tani Drogi Luksusowy Zwykły Duży Mały Jeśli liczba n będzie parzysta, medianą w badanej zbiorowości będzie średnia Samochód „F” n n 1 Samochód „H” arytmetyczna kategorii odpowiadającej jednostce i . 2 2 Skale Likerta są bardzo popularne w badaniach marketingowych, ponieważ są łatwe do wyjaśnienia i czytelne. Często wykorzystywane są w kwestionariuszach, ankietach pocztowych i telefonicznych. Analiza profilowa polega na połączeniu za pomocą linii (dla każdego badanego obiektu zastosujemy linię o innym kształcie: ciągłą, przerywaną, kropkową) otrzymanych dla każdej cechy median. Skala Stapela Skala Stapela została zaprojektowana dla sytuacji, w których niektóre cechy badanych obiektów nie mają oczywistych przeciwieństw. Pozycje skal nominalnych są zestawem skal jednobiegunowych, których bieguny mają wartości od -5 do +5 (ew. -3 do +3). Do budowy tej skali wystarczy zastosowanie po jednym przymiotniku dla każdej skali, bez szukania antonimów. Zaletą skali Stapela jest łatwiejsze jej zastosowanie w porównaniu ze skalą semantyczną a rezultaty obu pomiarów są sobie równoważne. Skalę tą stosuje się do pomiaru opinii i wyobrażeń o punktach sprzedaży, nowych produktach, oraz środkach reklamy. Pomiar może być przeprowadzony za pomocą ankiety, wywiadu, w tym: telefonicznego. Dane zebrane z pomiaru mogą być analizowane za pomocą metody profilowej. Przykład Jak ocenia Pan(i) niżej podane 4 cechy charakteryzujące sklep X. (Jeżeli ocenia Pan(i) daną cechę pozytywnie, prosimy wskazać, w jakim stopniu jest ona pozytywna, przez zakreślenie jednej z kratek od +3 do +1. Jeśli ocena ta jest negatywna - prosimy zaznaczyć jej stopień odpowiednio od -1 do –3). A. Czystość B. Obsługa C. Wybór D. Wystrój +3 +3 +3 +3 +2 +2 +2 +2 +1 +1 +1 +1 -1 -1 -1 -1 -2 -2 -2 -2 -3 -3 -3 -3 Z przykładu widać, że respondent jest poinstruowany o sposobie oznaczenia przedziału skali odpowiadającemu jego preferencjom, wyobrażeniom lub odczuciom. W przykładzie nie uwzględniono przedziałów neutralnych. Skala Stapela jest przykładem skalowania wymuszającego. Skala Likerta. Skalowanie tego typu polega na przedstawieniu zbioru pewnych sformułowań, które respondent musi ocenić zwykle na 5-stopniowej skali, np. (1) w pełni się zgadzam, (2) zgadzam się, (3) ani się zgadzam, ani się nie zgadzam, (4) nie zgadzam się, (5) absolutnie się nie zgadzam. Stopnie skali są opisane w kwestionariuszu werbalnie. Wartości numeryczne (od 1 do 5) nie są podawane w kwestionariuszach (na rysunku pokazano je w celu ilustracji sposobu liczenia - do celów redukcji i analizy danych. Kierunek przyporządkowania skal numerycznych nie musi się zgadzać z wartościami werbalnymi. Wyższe numery oznaczają zazwyczaj postawy pozytywne, niższe - negatywne). Przykład cechowania kwestionariusza za pomocą skali Likerta Poniżej wymieniono czynniki wpływające na działalność firm zagranicznych w Polsce. Prosimy o zaznaczenie na ile Pan(i) zgadza się z tym Istnieje chłonny rynek wewnętrzny w Polsce Konkurencja firm polskich jest poważną przeszkodą W Polsce jest możliwy szybki wzrost zysków W pełni się zgadzam Zgadzam się Ani się zgadzam, ani się nie zgadzam Nie zgadzam się Zupełnie się nie zgadzam (5) (4) (3) (2) (1) (1) (2) (3) (4) (5) Redukcja danych. Polega na zliczaniu odpowiedzi dla poszczególnych pozycji albo punktów dla poszczególnych respondentów lub ich grup. Zliczanie punktów dla poszczególnych pozycji Przebadano 120 respondentów (wywiad). Postawy respondentów wobec stwierdzenia „Istnieje chłonny rynek wewnętrzny w Polsce” były następujące: Opcja Całkowicie się zgadzam Zgadzam się Ani się zgadzam .. Nie zgadzam się Całkowicie się nie ... Razem Wartość numeryczna [a] 5 4 3 2 1 x Ilość odpowiedzi [b] 60 30 10 15 5 120 Szereg skumulowany 60 90 100 115 120 x [a x b] 300 120 30 30 5 485 Dominantą jest kategoria 5; medianą – kategoria 4,5. Średnia arytmetyczna (ważona) = 485 4,04 120 Aby średnia arytmetyczna dobrze reprezentowała odpowiedzi – warunkiem jest koncentracja danego zjawiska (jako miarę koncentracji używa się odchylenia standardowego. Wartości odchylenia standardowego wskazują na warunkową użyteczność średniej przy reprezentowaniu próbki. Im mniejsze jest odchylenie standardowe, tym aktualne dane są bliższe średniej). Miary tendencji centralnej (dominanta, mediana i średnia) - kształtują się między 5 i 4, tzn. między „Całkowicie się zgadzam” i „Zgadzam się”. A zatem powiemy, że wśród właścicieli firm zagranicznych działających w Polsce jest rozpowszechniona opinia o chłonności rynku wewnętrznego w Polsce. Zliczanie punktów dla poszczególnych respondentów. Załóżmy, że respondent przydzielił pierwszej pozycji ocenę „całkowicie się zgadzam” (5), drugiej (3), trzeciej (4), łącznie 12 punktów. Po zsumowaniu punktów dla każdego respondenta porządkuje się respondentów wg uzyskanych punktów. Respondenci, którzy uzyskali dużą liczbę punktów są nastawieni przychylnie do danego obiektu, a respondenci o najmniejszej liczbie punktów - mają postawę negatywną. Plan: 1. Kodowanie i tabulacja danych. 2. Tworzenie i interpretacja tabel kontyngencji. 1. Kodowanie i tabulacja danych Wyniki pomiarów przyjmują postać danych, które muszą być odpowiednio zapisane dla celów ich dalszego przetwarzania. Najbardziej dogodnym narzędziem rejestrowania danych są arkusze kalkulacyjne, które zawierają odpowiednią liczbę wierszy i kolumn pozwalających na jednoznaczną identyfikację obiektów badanych (przypadków) i ich cech (zmiennych). Zwykle wiersze przeznaczone są dla obiektów, kolumny dla cech. Dane położone na przecięciach wierszy i kolumn oznaczają wartości cech (zmiennych) odpowiadających poszczególnym obiektom (przypadkom). Kodowanie danych jest zależne od zastosowanej w pomiarze skali pomiarowej. Skala nominalna Jednej skali nominalnej przyporządkowujemy jedną kolumnę (gdy możliwe odpowiedzi tworzące skalę są rozłączne), lub tyle kolumn, ile jest pozycji skali, gdy odpowiedzi są nierozłączne). Każda cecha kodowana jest za pomocą symboli literowych (np. płeć: K, M.), cyfrowych, lub całych słów. Skala porządkowa Każdej skali porządkowej przypisuje się maksymalnie tyle kolumn, ile jest porządkowanych obiektów (cech produktu, marek, firm). Kolumny odpowiadają: - rangowanym obiektom (w wierszach wpisuje się rangi przypisane im przez kolejnych respondentów), albo - kolejności rangowej obiektów. W wierszach wpisuje się symbole obiektów, którym przypisana została przez kolejnych respondentów dana ranga.. (W tej sytuacji można np. do kodowania przyjąć tylko 3 kolumny, uwzględniając tylko trzy pierwsze miejsca w rankingu). Skala przedziałowa Każdej skali przedziałowej odpowiada jedna kolumna. W kolumnie tej wpisuje się symbole cyfrowe odpowiadające określonym poziomom ocen, przypisywanym przez kolejnych respondentów ocenianemu obiektowi. Skala ilorazowa Kodowanie polega na wpisywaniu w odpowiedniej kolumnie określonych wartości cechy dla każdego obiektu. Są to wartości rzeczywiste, niekodowane. Każdej skali ilorazowej przypisuje się jedną kolumnę. Przykład zakodowanych odpowiedzi: Nr resp. 1 2 3 4 1 2 3 4 5 6 7 8 9 10 11 12 13 M K M M P S W W 1 1 2 3 2 3 1 1 3 2 3 2 A B A A B C B D D D C B 7 6 7 5 4 5 3 7 3 5 4 6 2 1 4 1 18 25 30 28 Kolumna 1 – płeć (skala nominalna). Kolumna 2 – wykształcenie (podstawowe, średnie, wyższe). Skala nominalna. Kolumny 3-5 - Pytanie: „Uszereguj marki samochodów X,Y,Z w kolejności preferencji”. Każdej marce przyporządkowujemy jedną kolumnę. Skala porządkowa. Kolumny 6-8 - Pytanie: „Uszereguj cechy samochodu A,B,C i D w kolejności ich ważności”. Rezerwujemy 3 kolumny, odpowiednio dla miejsca I, II i III. Skala porządkowa. Kolumny 9-12 - Pytanie: „Oceń marki A,B,C,D na skali 7-stopniowej”. Rezerwujemy 4 kolumny do zakodowania ocen przypisanych przez kolejnych respondentów każdej marce. Skala przedziałowa (złożona z 4 skal prostych).. Kolumna 13 – Pytanie: „Ile masz lat?”. Skala ilorazowa. Tabulacja Po odpowiednim zakodowaniu danych rozpoczyna się zwykle proces tabulacji, czyli zliczania, sumowania, sortowania, grupowania oraz zestawiania wyników w formie tablic częstości i tablic wielodzielczych. W przypadku tablic częstości chodzi o rozkład danej cechy w przedziale jej zmienności. Tablice wielodzielcze - są budowane na podstawie odpowiedniej kombinacji cech korelowanych ze sobą. Jeśli korelowane są ze sobą 2 cechy, to mamy tablice dwudzielcze, w których poziomom wartości jednej cechy odpowiadają wiersze, a poziomom wartości drugiej cechy – kolumny. Na przecięciu wierszy i kolumn znajdują się liczebności opisujące dwuwymiarowy rozkład częstości występowania danych cech. W przypadku korelowania ze sobą większej ilości cech – mamy do czynienia z tablicami wielowymiarowymi. 2. Tworzenie i interpretacja tabel kontyngencji. Budowa i interpretacja tabeli dwudzielczej 2.1. Budowa tabeli dwudzielczej Tabele dwudzielcze są najczęściej spotykanym narzędziem redukcji i analizy danych. Tworzenie ich polega na jednoczesnym zestawieniu odpowiednich dwóch zmiennych w tabeli, w której poziomy jednej zmiennej znajdują się w wierszach tabeli (boczku), a poziomy drugiej zmiennej w kolumnach (główce). W polach tabeli znajdują się liczebności (obserwacje), odpowiadające jednocześnie danym poziomom obu zmiennych. Tabela dwudzielcza – dane surowe Zakupy produktu X częste rzadkie suma negatywne 30 70 100 częste rzadkie suma negatywne 15% (30%) [29%] 35% (70%) [74%] (100%) Liczebności (Oij ) Wartości oczekiwane ( E ) ij Suma % w wierszach = 100 Dochód Niski Wysoki Opinie o produkcie X pozytywne 75 25 100 suma 105 95 200 Tabela dwudzielcza – rozkłady procentowe Zakupy produktu X Tab.3. Wartości empiryczne i oczekiwane Opinie o produkcie X pozytywne 37% (75%) [71%] 13% (25%) [26%] (100%) suma [100%] [100%] 100% W przypadku wnioskowania o zależnościach przyczynowo- skutkowych między zmienną zależną i niezależną - zależności te można określić w najprostszy sposób, obserwując kształtowanie się rozkładów odpowiedzi w polach tabeli. - w przypadku tabeli 2x2 wystarczy stwierdzić krzyżowanie się relacji. W tab. 2.2. większe wartości z pierwszej i drugiej kolumny i mniejsze wartości z tych kolumn przeplataj się „na krzyż”. - kierunek rozkładu obserwacji może ukazać związki przyczynowe. Jeżeli rozkład procentowy wartości zmiennych niezależnych rośnie z lewej do prawej strony tabeli, to zmienna zależna jest dodatnio związana ze zmienną niezależną – jeżeli maleje, związek jest odwrotny. 2.2. Istotność związku Pierwszym problemem w interpretacji tabel dwudzielczych jest określenie stopnia statystycznej istotności powiązań między zmiennymi. Wykorzystywane są w tym celu różne statystyczne testy istotności, w zależności od poziomu pomiaru. W przypadku tabel kontyngencji, gdy badane zmienne mierzone są w skali nominalnej, do oceny istotności związków między zmiennymi najczęściej stosuje się test 2 , mierzący niezależność analizowanych zmiennych. Ogółem Liczba samochodów mniej niż 2 48 40 88,9% 26 34 56,5% 74 74% 2 i więcej 6 14 11,1% 20 12 43,5% 26 26% ogółem 54 54% 100% 46 46% 100% 100 100% Hipoteza zerowa w tym teście zakłada, że między danymi zmiennymi nie ma związku (zmienne są niezależne). Sprawdzenie tej hipotezy polega na obliczeniu w pierwszym kroku wartości oczekiwanych (tj. takich, których oczekuje się w poszczególnych komórkach tabeli, jeżeli badane zmienne są rzeczywiście niezależne). Wartości oczekiwane otrzymuje się przez pomnożenie odpowiednich sum kolumn i wierszy, i podzielenie przez sumę całkowitą. Następnie należy porównać wartości oczekiwane z rzeczywistymi i określić, czy występują różnice między tymi wartościami. Jeżeli są one niewielkie, to należy przyjąć hipotezę, że zmienne te są niezależne (związek między zmiennymi jest wtedy nieistotny statystycznie). Formuła obliczania niezależności: n n 2 i 1 j 1 (Oij Eij ) 2 Eij gdzie: Oij - wartości empiryczne w i-tym wierszu i j-tej kolumnie tabeli, Eij - wartości oczekiwane w i-tym wierszu i j-tej kolumnie. Co najmniej 20% komórek powinno zawierać oczekiwaną wartość większą od 5, a w żadnej nie może być wartości mniejszej od 1. Obserwacje powinny być prowadzone w sposób niezależny (nie można wykorzystać danych z dwóch powtórzonych pomiarów na tej samej próbie). Gdy próby do obserwacji są zależne od siebie – należy zastosować np. test McNemara. Liczba stopni swobody dla tabeli kontyngencji wynosi (w-1)(k-1), gdzie w – liczba wierszy, k – liczba kolumn. Mając liczbę stopni swobody i przyjęty poziom istotności alfa, odczytuje się z tablic statystycznych wartość krytyczną 2 . Jeżeli wartość ta jest większa od wartości obliczonej na podstawie danych empirycznych, to nie ma podstaw do odrzucenia hipotezy o niezależności zmiennych. 2.3. Siła związku Test 2 mierzy tylko istotność związku, nie pozwala jednak na zmierzenie ani jego siły, ani przyczynowego charakteru powiązań między zmiennymi. Wysoka wartość 2 nie wskazuje na istnienie silnego związku między zmiennymi. Do określenia siły związku stosowane są różne współczynniki korelacji, z których najczęściej używanym jest współczynnik kontyngencji C: 2 n 2 gdzie n – wielkość próby. Przy braku zależności między zmiennymi współczynnik C wynosi zero, natomiast górna granica (najsilniejszy związek) zależy od liczby kategorii poszczególnych zmiennych. Dla tabeli n x n granica ta równa się: w 1 w C gdzie w – liczba wierszy w tabeli.