Mapa Serwisu
|
Analiza czynnikowa |
Admin1 dnia marca 10 2007 22:52:55
|
Analiza czynnikowa
Podstawowe informacje
Koncepcja analizy czynnikowej powstała i rozwinęła się w psychologii anglosaskiej. Po raz pierwszy została opisana w roku 1904 w artykule C.Spearmana. Jednak podstawy teoretyczne, jak i możliwości praktycznych rozwiązań podał dopiero w latach trzydziestych L.L.Thurstone.
Najważniejsze wiadomości o analizie czynnikowej można ująć
w następujących punktach:
Jest to jedna z metod wielowymiarowej analizy danych;
Jest używana do analizowania dużej ilości danych;
Jej istotą jest możliwość przekształcania dużej liczby zmiennych do mniejszej;
Ma ona zastosowanie m.in. w badaniach marketingowych
Na etapie doboru zmiennych jako metoda redukcji opisu:
W wyniku zastosowania analizy czynnikowej następuje jednocześnie redukcja liczby zmiennych oraz ich ortogonalizacja (ponieważ wyodrębnione w jej wyniku czynniki są nieskorelowane).
Fakt takiej transformacji danych jest bardzo ważny z punktu widzenia analizy regresji (wykorzystywanej do analizy danych), w której wymaga się, aby zmienne niezależne były nieskorelowane.
Do wnioskowania o strukturze badanego zjawiska, czyli do wyszukiwania ogólnych prawidłowości w analizowanym zjawisku.
Ma to znaczenie szczególnie w badaniu zachowań (reakcji) konsumentów na rynku – z dużego zbioru zmiennych w wyniku analizy czynnikowej otrzymuje się kilka czynników głównych, które decydują np. o wyborze danego produktu przez konsumenta. Np. Stoetzel za pomocą analizy czynnikowej wyodrębnił trzy czynniki decydujące o wyborze likieru przez konsumentów francuskich:
1. Słodkość likieru
2. Cena
3. Popularność w regionie.
Do konstrukcji map percepcji.
Mapy te przedstawiają usytuowanie badanych obiektów na płaszczy¼nie. W ten sposób analiza czynnikowa pozwala określić pozycję produktu na rynku na tle produktów konkurencyjnych.
Definicja
Analiza czynnikowa to zespół metod i procedur statystycznych pozwalających na sprowadzenie dużej liczby badanych zmiennych do znacznie mniejszej liczby wzajemnie niezależnych (nieskorelowanych) czynników.
Wyodrębnione czynniki mają inną interpretację merytoryczną jednocześnie zachowując znaczną część informacji zawartych w zmiennych pierwotnych.
Np. jeśli do oceny jakiegoś produktu żywnościowego użyto zestawu skal, za pomocą których badani oceniali wiele jego różnych cech (smak, zapach, konsystencja, kolor, kształt, opakowanie itp.) można za pomocą analizy czynnikowej starać się sprawdzić, czy oceny produktu nie da się sprowadzić do oceny ze względu na zaledwie kilka czynników, które - bezpośrednio - nie były ujęte w oddzielnych punktach skali, np. wymiary "łącznej oceny smaku i zapachu" oraz wyglądu.
Cele Analizy czynnikowej
Do podstawowych celów analizy czynnikowej zalicza się:
Identyfikacja czynników wspólnych ukrytych w zbiorze zmiennych;
Redukcja wymiarów przestrzeni zmiennych;
Ortogonalizacja przestrzeni, w której rozpatrywane są obiekty, będące przedmiotem badań;
Identyfikacja charakteru zmiennych;
Transformacja układu zmiennych w jakościowo nowy układ czynników głównych;
Prezentacja graficzna zbioru obserwacji wielowymiarowych.
Procedura Analizy Czynnikowej:
Przedmiotem analizy czynnikowej jest macierz danych, zawierająca n realizacji m zmiennych:
X=[xij]nxm
gdzie i=1,...,n; j=1,...,m; m
W wyniku transformacji wartości zmiennych za pomocą formuły standaryzacji uzyskuje się zmienne o jednakowej wartości oczekiwanej (równej zero) i jednostkowym odchyleniu standardowym:
Z=[zij]nxm
Zakłada się, że pomiędzy zmiennymi Xj(j=1,...,m) zachodzą związki, których siłę i kierunek określają współczynniki korelacji liniowej Pearsona zawarte w macierzy:
R=[rkj]mxm
gdzie:
rkj = ZTZ=
Przyjmuje się, że ¼ródłem wzajemnych zależności między zmiennymi są określone wspólne czynniki. Ponadto każda zmienna charakteryzuje się pewnymi specyficznymi właściwościami. Składniki wspólne są uznawane za nośniki tej samej informacji, co prowadzi do wniosku, że można je zastąpić nowymi, syntetycznymi czynnikami głównymi.
Uzyskane czynniki główne są wzajemnie ortogonalne, a zatem zawarte w nich zasoby informacyjne mają charakter unikatowy. Przy czym ich liczba jest mniejsza od liczby zmiennych.
Podstawą identyfikacji składników wspólnych i specyficznych jest w analizie czynnikowej podział wariancji poszczególnych zmiennych na wariancję wspólną i specyficzną, co przedstawia się następująco:
vj= hj2+bj2
gdzie:
vj - wariancja całkowita j-tej zmiennej
hj2 - zasób zmienności wspólnej j-tej zmiennej (część wariancji, która jest objaśniana przez czynniki główne)
bj2 - zasób zmienności specyficznej j-tej zmiennej (swoistość)
Przy czym:
vj =
bj2 = 1- hj2
Konieczne jest również spełnienie poniższych założeń:
czynniki wspólne nie są skorelowane ze sobą;
czynniki specyficzne również nie są ze sobą skorelowane;
czynniki wspólne nie są skorelowane z czynnikami specyficznymi;
czynniki wspólne są zestandaryzowane, tzn. E(Fi)=0 i V(Fi)=1;
Przedstawione założenia umożliwiają sformułowanie podstawowego modelu matematycznego analizy czynnikowej w postaci układu równań liniowych:
Z = AF + BU
gdzie:
Z-macierz zmiennych
A-macierz ładunków czynnikowych składników wspólnych
F-macierz czynników wspólnych
B-macierz ładunków czynnikowych składników specyficznych
U-macierz czynników specyficznych
W modelu analizy czynnikowej zakłada się, że każda z obserwowalnych zmiennych jest funkcją liniową zmiennych nieobserwowalnych (t.zw. czynników wspólnych) oraz pojedynczej zmiennej specyficznej.
W związku z tym uszczegółowione równanie analizy czynnikowej przedstawia się następująco:
gdzie:
m - liczba zmiennych pierwotnych
p - liczba czynników głównych (wspólnych)
Zj - j-ta zmienna standaryzowana (pierwotna)
Fl - l-ty czynnik wspólny
Uj - j-ty czynnik swoisty
ajl – ładunek czynnikowy l-tego czynnika Fl w j-tej zmiennej obserwowalnej
W przedstawionym modelu struktura zależności pierwotnego zbioru zmiennych jest reprezentowana przez macierz kowariancji:
V = AAT + B2
gdzie:
V = [vkj]mxm - macierz kowariancji zmiennych
Vkj =
Po usunięciu z równania składnika reprezentującego wariancję specyficzną otrzymuje się tzw. zredukowaną macierz korelacji:
R = AAT
gdzie:
R = [rkj]mxm - zredukowana macierz korelacji zmiennych
rkj =
Podstawowe zadanie analizy czynnikowej sprowadza się do rozwiązania równania:
R = AAT
ze względu na macierz A, czyli wyznaczenia ładunków czynnikowych składników wspólnych.
Znalezienie tego rozwiązania kończy właściwą analizę czynnikową.
Najczęściej stosowane metody estymacji elementów macierzy A:
1) Metoda głównego czynnika wykorzystująca metodę głównych składowych;
2) Metoda centroidalna;
3) Metoda największej wiarygodności.
Interpretacja graficzna metody:
Przy interpretacji graficznej zarówno macierz korelacji R, jak i zredukowana macierz korelacji R’ zawierają wszystkie informacje o cechach, czyli zmiennych obserwowalnych. Macierz korelacji określa wzajemne położenie wektorów względem siebie, z podaniem ich długości i kątów zawartych między nimi.
Osie tego układu tworzą czynniki wspólne i czynniki specyficzne, gdy korzysta się z macierzy korelacji R lub tylko czynniki wspólne w przypadku zredukowanej macierzy korelacji R’.
Kąty pomiędzy wektorami reprezentującymi poszczególne zmienne Xi w przestrzeni czynników wspólnych są mniejsze niż w przestrzeni utworzonej z czynników wspólnych i specyficznych.
Rotacja czynników:
Rotacja czynników jest to dość istotny etap analizy czynnikowej, który polega na sprowadzeniu struktury ładunków czynnikowych do prostej struktury, w której punkty reprezentujące zmienne skupiają się wokół osi czynników.
Istotne jest, że wskutek rotacji zasoby zmienności wspólnej hj2 określające udział wszystkich czynników wspólnych w wyjaśnianiu wariancji zmiennej Xj nie ulegają zmianie.
Transformacji ortogonalnej danej macierzy ładunków czynnikowych A w inną odpowiada obrót układu współrzędnych w przestrzeni czynnikowej dookoła początku układu. Obrót ten nosi nazwę rotacji czynników.
Aby uzyskać możliwie najlepsze położenie układu osi czynnikowych w danej przestrzeni czynnikowej powinny być spełnione odpowiednie kryteria.
Kryteria prostej struktury dla macierzy ładunków A o wymiarach p x k wg Thurstona:
w każdym wierszu macierzy A powinno być przynajmniej jedno 0,
każda kolumna powinna zawierać przynajmniej k zer,
każda para czynników powinna zawierać cechy, dla których ładunki znikają w jednej kolumnie (są bliskie zeru), natomiast w drugiej są istotnie różne od zera,
jeśli k>= 4, to każda para kolumn macierzy A powinna zawierać dużą liczbę cech z ładunkami zerowymi w obu kolumnach.
Spełnienie wyżej wymienionych kryteriów prowadzi do tego, że badane cechy można podzielić na rozłączne podzbiory, w których ładunki są wysokie dla jednego czynnika, średnie lub niskie dla paru innych czynników oraz prawie zerowe dla czynników pozostałych.
Przykład: Postrzeganie 9 napojów bezalkoholowych ze względu na 8 zmiennych.
Zmienne przedstawiono na skali semantycznej, a krańce skali określono w postaci antonimów. Przykładową ocena napoju Pepsi dokonana przez jednego respondenta przedstawia się następująco:
Na podstawie wielu ankiet dokonano uśrednienia ich wyników, co zawiera tabela:
Podstawowym celem badania było określenie pozycji wybranych napojów na rynku napojów bezalkoholowych oraz ustalenie wzajemnych relacji między konkurującymi ze sobą popularnymi napojami bezalkoholowymi. W wyniku zastosowania procedury analizy czynnikowej, z pierwotnego zbioru 8 zmiennych otrzymano kilka czynników głównych, decydujących o wyborze przez konsumenta danego napoju.
Za pomocą techniki głównych składowych wyodrębniono 3 czynniki główne zawierające łącznie prawie 90% zmienności wspólnej:
Po zastosowaniu procedury analizy czynnikowej pierwotny zbiór badanych 9 napojów w przestrzeni 8-wymiarowej został przekształcony w zbiór 9 napojów w trójwymiarowej przestrzeni niezależnych czynników głównych, co można przedstawić graficznie w trzech przestrzeniach dwuwymiarowych:
Konfiguracja napojów w przestrzeni czynników 1 i 2
Konfiguracja napojów w przestrzeni czynników 1 i 3
Konfiguracja napojów w przestrzeni czynników 2 i 3
W wyniku przeprowadzenia analizy czynnikowej dokonano podziału badanych napojów na klasy:
I klasa: Pepsi, Coca Cola (średnia popularność, niska dietetyczność)
II klasa: Pepsi Light, Coca Cola Light (średnia popularność, wysoka dietetyczność)
III klasa: Sprite, 7 UP (średnia dietetyczność, najwyższa popularność)
IV klasa: Fanta, Mirinda, Sinalco (Fanta i Mirinda-najmniejsza dietetyczność; Mirinda i Sinalco-najmniejsza popularność
Literatura:
Ostasiewicz W., Statystyczne metody analizy danych, Wydawnictwo Akademii Ekonomicznej im. Oskara Langego we Wrocławiu, Wrocław 1998,;
Walesiak M. Metody analizy danych marketingowych, PWN, Warszawa 1996;
Zeliaś A. Red nauk., Ekonometria przestrzenna, PWE, Warszawa 1991;
|
|
Zaloguj się, żeby móc dodawać komentarze.
|
|
Dodawanie ocen dostępne tylko dla zalogowanych Użytkowników.
Proszę się zalogować lub zarejestrować, żeby móc dodawać oceny.
Brak ocen.
|
|
|
|