Vienas iš statistikos tikslų yra duomenų prasmingas išdėstymas. Dvipusės lentelės yra svarbus būdas organizuoti tam tikro tipo suporuoti duomenys. Kaip ir statant bet kuriuos grafikus ar lenteles statistikoje, labai svarbu žinoti kintamųjų tipus, su kuriais mes dirbame. Jei turime kiekybinius duomenis, tada grafikas, toks kaip a histograma arba stiebo ir lapų sklypas turėtų būti naudojamas. Jei mes turime kategorinius duomenis, tada juostinė diagrama arba pyrago diagrama yra tinkamas.
Dirbdami su suporuotais duomenimis, turime būti atidūs. Yra porinis kiekybinių duomenų pasiskirstymas, bet koks grafikas yra suporuotas kategoriškas duomenys? Kai turime du kategorinius kintamuosius, turėtume naudoti dvipusę lentelę.
Dvipusio stalo aprašymas
Pirmiausia primename, kad kategoriniai duomenys yra susiję su bruožais ar kategorijomis. Ji nėra kiekybinė ir neturi skaitinių verčių.
Į dvipusę lentelę įtraukiamos visos dviejų kategorinių kintamųjų vertės arba lygiai. Visos vieno kintamojo vertės yra išvardytos vertikaliame stulpelyje. Kito kintamojo vertės pateikiamos horizontalioje eilutėje. Jei pirmasis kintamasis turi
m reikšmes, o antrasis kintamasis turi n vertės, tada bus iš viso mn įrašai lentelėje. Kiekvienas iš šių įrašų atitinka tam tikrą kiekvieno iš šių kintamųjų vertę.Kiekvienoje eilutėje ir stulpelyje įrašai yra sudėti. Šios sumos yra svarbios nustatant ribinį ir sąlyginį pasiskirstymą. Šios sumos yra svarbios ir atliekant chi-kvadrato nepriklausomybės testą.
Dvipusio stalo pavyzdys
Pavyzdžiui, mes apsvarstysime situaciją, kai apžvelgsime kelis statistikos kursų skyrius universitete. Norime sudaryti dvipusę lentelę, kad nustatytume, kokie skirtumai, jei yra, tarp vyrų ir moterų trasoje. Norėdami tai pasiekti, suskaičiuojame kiekvienos raidės pažymį, kurį pelnė kiekvienos lyties nariai.
Atkreipiame dėmesį, kad pirmasis kategorinis kintamasis yra lytis ir yra dvi galimos vertybės tiriant vyrą ir moterį. Antrasis kategorinis kintamasis yra raidžių laipsnis ir yra penkios reikšmės, kurias nurodo A, B, C, D ir F. Tai reiškia, kad mes turėsime dvipusę lentelę su 2 x 5 = 10 įrašų, plius papildoma eilutė ir papildomas stulpelis, kuris bus reikalingas lentelių eilutėms ir stulpeliams apibendrinti.
Mūsų tyrimas rodo, kad:
- 50 vyrų pelnė A, o 60 moterų - A.
- 60 vyrų uždirbo B, o 80 moterų uždirbo B.
- 100 vyrų uždirbo C, o 50 moterų - C.
- 40 vyrų uždirbo D, o 50 moterų uždirbo D.
- 30 vyrų uždirbo F, o 20 moterų uždirbo F.
Ši informacija įrašyta į dvipusę lentelę žemiau. Iš viso kiekvienoje eilutėje nurodoma, kiek buvo pelnyta kiekvienos rūšies pažymių. Stulpelių sumos nurodo vyrų ir moterų skaičių.
Dvipusių lentelių svarba
Dvipusės lentelės padeda tvarkyti mūsų duomenis, kai turime du kategorinius kintamuosius. Ši lentelė gali būti naudojama mums padėti palyginti dvi skirtingas duomenų grupes. Pvz., Galėtume apsvarstyti santykinį vyrų statistikos kursą palyginti su moterimis.
Tolesni žingsniai
Sudarius dvipusę lentelę, kitas žingsnis gali būti duomenų statistinė analizė. Mes galime paklausti, ar kintamieji, kurie yra tyrime, yra vienas nuo kito nepriklausomi, ar ne. Norėdami atsakyti į šį klausimą, galime naudoti chi-square testą ant dvipusio stalo.
Dvipusis lentelė klasėms ir lytims
Patinas | Moteris | Iš viso | |
A | 50 | 60 | 110 |
B | 60 | 80 | 140 |
C | 100 | 50 | 150 |
D | 40 | 50 | 90 |
F | 30 | 20 | 50 |
Iš viso | 280 | 260 | 540 |