Kaip klasterių analizę naudoti socialinių mokslų tyrimuose

Klasterių analizė yra statistinis metodas, naudojamas nustatyti, kaip įvairius vienetus - žmones, grupes ar visuomenes - galima sugrupuoti dėl jų bendrų savybių. Taip pat žinomas kaip grupavimas, tai tiriamoji duomenų analizės priemonė, kurios tikslas yra suskirstyti įvairius objektus į grupes taip, kad, kai jie priklausantys tai pačiai grupei, jie turi maksimalų asociacijos laipsnį, o kai nepriklauso tai pačiai grupei, jų asociacijos laipsnis yra minimalus. Skirtingai nuo kai kurių kitų statistiniai metodai, struktūrų, kurios nėra atskleidžiamos atliekant klasterių analizę, nereikia paaiškinti ar aiškinti - ji nustato duomenų struktūrą nepaaiškindama, kodėl jie egzistuoja.

Kas yra klasterizacija?

Klasteriai egzistuoja beveik visuose mūsų kasdienio gyvenimo aspektuose. Imk, pavyzdžiui, maisto prekių parduotuvėje esančius daiktus. Tose pačiose ar netoliese esančiose vietose visada eksponuojami skirtingi daiktai - mėsa, daržovės, soda, grūdai, popieriaus gaminiai ir kt. Tyrėjai dažnai nori tą patį padaryti su duomenimis ir sugrupuoti objektus ar subjektus į prasmingų klasterių grupes.

instagram viewer

Tarkime, kad pažiūrime į šalis ir norime jas sugrupuoti į grupes, remiantis tokiomis savybėmis kaip socialiniai mokslai. darbo pasidalijimas, kariuomenė, technologijos ar išsilavinę gyventojai. Pastebėtume, kad Didžioji Britanija, Japonija, Prancūzija, Vokietija ir JAV turi panašias savybes ir būtų sujungtos į grupes. Uganda, Nikaragva ir Pakistanas taip pat būtų suskirstyti į skirtingas grupes, nes jos turi skirtingas savybes, įskaitant žemą turto lygį, paprastesnį darbo pasidalijimą, santykinai nestabilias ir nedemokratines politines institucijas ir žemas technologijas plėtra.

Klasterinė analizė paprastai naudojama tiriamajame tyrimų etape, kai tyrėjas to neturi iš anksto sugalvotos hipotezės. Paprastai tai nėra vienintelis naudojamas statistinis metodas, jis labiau atliekamas ankstyvajame projekto etape, kad padėtų vadovautis likusia analizės dalimi. Dėl šios priežasties reikšmingumo patikrinimas paprastai nėra nei aktualus, nei tinkamas.

Yra keletas skirtingų klasterių analizės tipų. Dvi dažniausiai naudojamos yra K reikšmių grupavimas ir hierarchinis grupavimas.

K reiškia klasterizavimą

„K“ reiškia grupavimas traktuoja duomenis kaip objektus, turinčius vietas ir atstumus vienas nuo kito (atkreipkite dėmesį, kad grupavime naudojami atstumai dažnai neatspindi erdvinių atstumų). Objektai padalijami į K viena kitą atimančias grupes, kad kiekvienoje klasteryje esantys objektai būtų tokie kuo arčiau vienas kito ir tuo pačiu metu kuo toliau nuo objektų, esančių kituose klasteriuose. Tada kiekvienai grupei būdingas jos pobūdis vidurkis arba vidurio taškas.

Hierarchinis klasterizavimas

Hierarchinis grupavimas yra būdas ištirti duomenų grupavimą vienu metu įvairiais masteliais ir atstumais. Tai daroma sukuriant klasterio medį su įvairiais lygiais. Skirtingai nuo K reiškia grupavimą, medis nėra atskiras klasterių rinkinys. Atvirkščiai, medis yra daugiapakopė hierarchija, kai vieno lygio grupės yra sujungtos kaip kitos aukštesnio lygio grupės. Naudojamas algoritmas prasideda kiekvienu atveju arba kintamuoju atskiroje klasteryje ir tada sujungia grupes, kol liko tik viena. Tai leidžia tyrėjui nuspręsti, koks klasterizacijos lygis yra tinkamiausias jo tyrimui.

Klasterio analizės atlikimas

Dauguma statistikos programinės įrangos programos gali atlikti klasterinę analizę. SPSS programoje pasirinkite analizuoti iš meniu klasifikuoti ir klasterio analizė. SAS, proc klasteris galima naudoti funkciją.

Atnaujino Nicki Lisa Cole, Ph.

instagram story viewer