Pirmasis ir trečiasis kvartilis yra aprašomoji statistika, kuri yra padėties duomenų rinkinyje matavimas. Panašiai, kaip mediana žymi duomenų rinkinio vidurio tašką, pirmasis kvartilis žymi ketvirtį arba 25% tašką. Maždaug 25% duomenų verčių yra mažesnės arba lygios pirmajai kvartilei. Trečiasis kvartilis yra panašus, tačiau viršutinių 25% duomenų verčių. Šias idėjas išsamiau panagrinėsime toliau.
Vidutinė
Yra keletas būdų, kaip išmatuoti centre duomenų rinkinio. Vidutinis, mediana, režimas ir vidurio diapazonas turi savo pranašumų ir trūkumų išreiškiant duomenų vidurį. Iš visų šių būdų rasti vidurkį, mediana yra labiausiai atsparus pašaliniams elementams. Tai žymi duomenų vidurį ta prasme, kad pusė duomenų yra mažesnė už mediana.
Pirmasis kvartilis
Nėra jokios priežasties, kad turime sustoti ties viduriu. O kas, jei nuspręstume tęsti šį procesą? Mes galėtume apskaičiuoti apatinę mūsų duomenų pusės medianą. Pusė 50% yra 25%. Taigi pusė arba ketvirtadalis duomenų būtų žemiau to. Kadangi kalbame apie ketvirtadalį pradinio rinkinio, ši duomenų apatinės pusės mediana vadinama pirmąja kvartile ir žymima
Q1.Trečiasis kvartilis
Nėra jokios priežasties, kodėl mes pažiūrėjome į apatinę duomenų dalį. Vietoj to, mes galėjome pažvelgti į viršutinę pusę ir atlikti tuos pačius veiksmus, kaip aprašyta aukščiau. Šios pusės mediana, kurią mes žymėsime Q3 taip pat padalija duomenų rinkinį į ketvirčius. Tačiau šis skaičius žymi aukščiausią ketvirtadalį duomenų. Taigi trys ketvirtadaliai duomenų yra mažesni už mūsų skaičių Q3. Štai kodėl mes skambiname Q3 trečioji kvartilė.
Pavyzdys
Pažvelkime į pavyzdį, kad viskas būtų aišku. Gali būti naudinga pirmiausia apžvelgti, kaip apskaičiuoti kai kurių duomenų mediana. Pradėkite nuo šio duomenų rinkinio:
1, 2, 2, 3, 4, 6, 6, 7, 7, 7, 8, 11, 12, 15, 15, 15, 17, 17, 18, 20
Iš viso rinkinyje yra dvidešimt duomenų taškų. Mes pradedame suradę vidurį. Kadangi duomenų skaičius yra lyginis, mediana yra dešimtosios ir vienuoliktosios verčių vidurkis. Kitaip tariant, mediana yra:
(7 + 8)/2 = 7.5.
Dabar pažvelkite į apatinę duomenų dalį. Šios pusės mediana yra tarp penktosios ir šeštosios verčių:
1, 2, 2, 3, 4, 6, 6, 7, 7, 7
Taigi pirmasis kvartilis yra lygus Q1 = (4 + 6)/2 = 5
Norėdami rasti trečiąjį kvartilį, pažiūrėkite į viršutinę pirminio duomenų rinkinio pusę. Turime rasti vidurkį:
8, 11, 12, 15, 15, 15, 17, 17, 18, 20
Čia mediana yra (15 + 15) / 2 = 15. Taigi trečiasis kvartilis Q3 = 15.
Tarpkvartilinis diapazonas ir penkių skaičių suvestinė
Kvartilai padeda susidaryti išsamesnį vaizdą apie visą mūsų duomenų rinkinį. Pirmasis ir trečiasis kvartilis suteikia mums informacijos apie mūsų duomenų vidinę struktūrą. Vidurinė duomenų pusė patenka tarp pirmojo ir trečiojo kvartilių, o centre yra mediana. Skirtumas tarp pirmosios ir trečiosios kvartilių, vadinamų tarpkvartalinis diapazonas, parodo, kaip duomenys išdėstomi apie mediana. Nedidelis tarpkvartalinis diapazonas rodo duomenis, sukauptus apie vidurį. Didesnis tarpkvartalinis diapazonas rodo, kad duomenys yra labiau išplatinti.
Išsamesnį duomenų vaizdą galima gauti žinant aukščiausią vertę, vadinamą maksimalia verte, ir mažiausią vertę, vadinamą mažiausia verte. Mažiausia, pirmoji kvartilė, mediana, trečioji kvartilė ir maksimali yra penkių verčių, vadinamų penkių skaičių santrauka. Veiksmingas šių penkių skaičių rodymo būdas vadinamas a „boxplot“ arba „box“ ir „ūsų“ grafikas.