Pagrindinių komponentų analizė (PCA) ir faktorinė analizė (FA) yra statistiniai metodai, naudojami duomenų sumažinimui ar struktūros aptikimui. Šie du metodai taikomi vienam kintamųjų rinkiniui, kai tyrinėtojas domisi atrasti, kurie rinkinio kintamieji sudaro nuoseklius pogrupius, kurie yra palyginti nepriklausomi nuo vieno kita. Kintamieji, kurie yra koreliuojami tarpusavyje, bet yra beveik nepriklausomi nuo kitų kintamųjų rinkinių, yra sujungiami į veiksnius. Šie veiksniai leidžia sutrumpinti analizės metu kintamųjų skaičių sujungiant kelis kintamuosius į vieną faktorių.
Konkretūs PCA arba FA tikslai yra apibendrinti koreliacijos tarp stebimų kintamųjų, norint sumažinti didelį stebimų kintamųjų skaičių iki mažesnio veiksnių skaičiaus, pateikti a regresijos lygtis pagrindiniam procesui, naudojant stebimus kintamuosius, arba patikrinti teoriją apie pagrindinių procesų pobūdį.
Pavyzdys
Tarkime, tyrėjui įdomu ištirti abiturientų savybes. Tyrėjas apklausia didelę magistrantų imtį pagal asmenybės savybes, tokias kaip motyvacija, intelektualiniai gebėjimai, mokslo istorija, šeimos istorija, sveikata, fizinės savybės, tt Kiekviena iš šių sričių matuojama keliais kintamaisiais. Tada kintamieji įvedami į analizę atskirai ir tiriamos jų sąsajos. Analizė atskleidžia koreliacijos modelius tarp kintamųjų, kurie, kaip manoma, atspindi pagrindinius procesus, turinčius įtakos abiturientų elgsenai. Pvz., Keli intelektinių gebėjimų kintamieji derinami su kai kuriais kintamaisiais iš mokslinės istorijos priemonių ir sudaro intelektą matuojantį veiksnį. Panašiai asmenybės matavimų kintamieji gali derėti su kai kuriais motyvacijos kintamaisiais ir moksliniais Istorijos priemonės sudaro faktorių, matuojantį studento pageidaujamą savarankiško darbo laipsnį - savarankiškumą faktorius.
Pagrindinių komponentų analizės ir faktorių analizės žingsniai
Pagrindinių komponentų analizės ir veiksnių analizės etapai apima:
- Pasirinkite ir išmatuokite kintamųjų rinkinį.
- Paruoškite koreliacijos matricą, kad atliktumėte PCA arba FA.
- Iš koreliacijos matricos ištraukite veiksnių rinkinį.
- Nustatykite veiksnių skaičių.
- Jei reikia, pasukite veiksnius, kad padidintumėte aiškumą.
- Interpretuokite rezultatus.
- Patikrinkite faktorių struktūrą, nustatydami faktorių konstrukcijos pagrįstumą.
Skirtumas tarp pagrindinių komponentų analizės ir faktorių analizės
Pagrindinių komponentų analizė ir faktorių analizė yra panašios, nes abi procedūros naudojamos supaprastinti kintamųjų rinkinio struktūrą. Tačiau analizės skiriasi keliais svarbiais būdais:
- PCA komponentai apskaičiuojami kaip linijiniai originalių kintamųjų deriniai. FA, pirminiai kintamieji yra apibrėžiami kaip linijiniai faktorių deriniai.
- PCA tikslas yra sudaryti kuo daugiau visos sumos dispersija kaip įmanoma kintamieji. FA tikslas yra paaiškinti kintamųjų kovariacijas ar koreliacijas.
- PCA naudojamas duomenims suskaidyti į mažesnį komponentų skaičių. FA naudojama suprasti, kokie konstrukcijos yra duomenų pagrindas.
Pagrindinių komponentų analizės ir faktorių analizės problemos
Viena iš PCA ir FA problemų yra ta, kad nėra kriterijaus kintamojo, pagal kurį būtų galima išbandyti sprendimą. Taikant kitus statistinius metodus, tokius kaip diskriminuojančios funkcijos analizė, logistinė regresija, profilio analizė ir daugiamatė dispersijos analizė, sprendimas vertinamas pagal tai, kaip gerai prognozuojama narystė grupėje. PCA ir FA nėra jokio išorinio kriterijaus, pavyzdžiui, narystės grupėje, kuriuo būtų galima išbandyti sprendimą.
Antroji PCA ir FA problema yra ta, kad po ekstrahavimo galimas apsisukimų skaičius begalinis skaičius, visi duomenys atspindi tą patį pradinių duomenų dispersijos dydį, tačiau veiksnys šiek tiek apibrėžtas skirtingi. Galutinį pasirinkimą priima tyrėjas, remdamasis jo aiškinamumo ir mokslinio naudingumo įvertinimu. Tyrėjai dažnai skiriasi tuo, kuris pasirinkimas yra geriausias.
Trečioji problema yra ta, kad FA dažnai naudojama „išsaugoti“ blogai apgalvotus tyrimus. Jei jokia kita statistinė procedūra nėra tinkama ar tinkama, duomenis galima bent jau analizuoti veiksniais. Tai leidžia daugeliui manyti, kad įvairios FA formos yra susijusios su aplaidžiais tyrimais.