Suporuoti statistikos duomenys, dažnai vadinami eilės poromis, nurodo du populiacijos individų kintamuosius, kurie yra susieti tarpusavyje, siekiant nustatyti jų ryšį. Kad duomenų rinkinys galėtų būti laikomas suporuotu, abi šios duomenų vertės turi būti pridėtos arba susietos viena su kita ir nenagrinėjamos atskirai.
Suporuotų duomenų idėja kontrastuojama su įprastu vieno skaičiaus susiejimu su kiekvienu duomenų tašku, kaip ir kituose kiekybiniai duomenys nustato, kad kiekvienas atskiras duomenų taškas yra susietas su dviem skaičiais, pateikdamas diagramą, leidžiančią statistikams stebėti šių kintamųjų ryšį populiacijoje.
Šis suporuotų duomenų metodas naudojamas, kai atlikus tyrimą tikimasi palyginti du populiacijos individų kintamuosius, kad būtų padaryta tam tikra išvada apie pastebėtą koreliaciją. Stebint šiuos duomenų taškus, svarbu susieti porą, nes pirmasis skaičius yra vieno dalyko matas, o antrasis yra kažko visiškai skirtingo dydžio.
Suporuotų duomenų pavyzdys
Tarkime, kad jei norite pamatyti suporuotų duomenų pavyzdį, mokytojas suskaičiuoja kiekvieno mokinio atliktų namų darbų skaičių įsijungė į tam tikrą vienetą ir tada suporuoja šį skaičių su kiekvieno studento procentais vieneto teste. Poros yra šios:
- Asmuo, atlikęs 10 užduočių, uždirbdamas 95 proc. (10, 95%)
- Asmuo, atlikęs 5 užduotis, uždirbdamas 80 proc. (5, 80%)
- Asmuo, atlikęs 9 užduotis, uždirbdamas 85 proc. (9, 85%)
- Asmuo, atlikęs 2 užduotis, uždirbdamas 50 proc. (2, 50%)
- Asmuo, atlikęs 5 užduotis, uždirbdamas 60 proc. (5, 60%)
- Asmuo, atlikęs 3 užduotis, uždirbdamas 70 proc. (3, 70%)
Kiekviename iš šių suporuotų duomenų rinkinių matome, kad priskyrimų skaičius visuomet yra pirmas užsakyta pora, o testo metu uždirbtas procentas yra antras, kaip matyti iš pirmojo atvejo (10, 95%).
Nors statistinė šių duomenų analizė taip pat galėtų būti naudojama apskaičiuojant vidutinį atliktos namų užduotys arba vidutinis testo rezultatas, gali būti ir kitų klausimų duomenys. Šiuo atveju mokytojas nori sužinoti, ar yra koks nors ryšys tarp namų darbų skaičiaus įsijungė ir atliko testą, o mokytojas, norėdamas į tai atsakyti, turės laikyti duomenis suporuotus klausimas.
Suporuotų duomenų analizė
statistiniai metodai apie koreliacija ir regresija naudojami analizuoti suporuotus duomenis, kur koreliacijos koeficientas kiekybiškai nustato, kiek duomenys yra tiesia linija, ir išmatuoja tiesinio ryšio stiprumą.
Regresija, kita vertus, naudojama kelioms programoms, įskaitant nustatant, kuri eilutė labiausiai tinka mūsų duomenų rinkiniui. Ši eilutė, savo ruožtu, gali būti naudojama įvertinti ar numatyti y vertės vertės x kurie nebuvo mūsų pirminio duomenų rinkinio dalis.
Yra specialus grafiko tipas, kuris ypač gerai tinka suporuotiems duomenims, vadinamiems scatterplot. Šiame grafiko tipas, viena koordinačių ašis žymi vieną suporuotų duomenų kiekį, o kita koordinačių ašis žymi kitą suporuotų duomenų kiekį.
Aukščiau pateiktų duomenų paskirstymo taškas turėtų x ašį žymėti įjungtų užduočių skaičių, o y ašis - vieneto testo balus.