Štai kaip padaryti „Boxplot“

„Boxplots“ savo vardą gauna iš to, kuo jie primena. Jie kartais vadinami dėžutėmis ir šluotelėmis. Šių tipų diagramos naudojamos diapazonui parodyti, medianair kvartilai. Kai jie bus užpildyti, langelyje yra pirmoji ir trečioji kvartilai. Šluotelės tęsiasi nuo dėžutės iki mažiausios ir didžiausios duomenų vertės.

Tolesniuose puslapiuose bus parodyta, kaip sudaryti duomenų rinkinį, kuriame yra ne mažiau kaip 20, pirmasis kvartilis 25, mediana 32, trečiasis kvartilis 35 ir daugiausiai 43.

Virš skaičių linijos nubrėžkite penkias vertikalias linijas, po vieną kiekvienai iš mažiausių verčių, pirmoji kvartilė, mediana, trečiasis kvartilis ir didžiausias. Paprastai minimumo ir maksimumo linijos yra trumpesnės už kvartilių ir vidurio linijas.

Mūsų duomenimis, mažiausias yra 20, pirmasis kvartilis yra 25, mediana yra 32, trečiasis kvartilis yra 35, o maksimalus - 43. Šias vertes atitinkančios linijos nubrėžtos aukščiau.

Toliau mes nupiešiame dėžutę ir naudodamiesi kai kuriomis linijomis nukreipiame mus. Pirmasis kvartilas yra kairioji mūsų dėžutės pusė. Trečiasis kvartilis yra dešinė mūsų dėžutės pusė. Mediana patenka į dėžutės vidų.

instagram viewer

Apibrėžus pirmąjį ir trečiąjį kvartilius, pusė visų duomenų verčių yra dėžutėje.

Dabar mes matome, kaip dėžutė ir ūsų grafikas gauna antrąją savo pavadinimo dalį. Norėdami parodyti duomenų diapazoną, nubraižomi ūsai. Pirmojoje kvartilėje brėžkite horizontalią liniją nuo minimumo iki kairiosios dėžutės pusės. Tai yra vienas iš mūsų ūsų. Nubrėžkite antrą horizontalią liniją nuo dėžutės dešinės pusės trečiame kvartale iki linijos, žyminčios maksimalų duomenų kiekį. Tai yra antrasis mūsų ūsas.

Mūsų dėžutės ir šnabždesio grafikas arba dėžutės grafikas yra baigtas. Iš pirmo žvilgsnio galime nustatyti duomenų verčių diapazoną ir laipsnį, kiek viskas suskirstyta. Kitas žingsnis parodo, kaip galime palyginti ir sugretinti du dėžutės pavyzdžius.

Dėžutėse ir ūsų grafikuose rodoma penkių skaičių duomenų rinkinio santrauka. Taigi galima palyginti du skirtingus duomenų rinkinius, kartu ištyrus jų pavyzdžius. Virš antrojo dėžutės brėžinio buvo nupieštas aukščiau mūsų pastatytas.

Yra keletas ypatybių, kurias verta paminėti. Pirma, abiejų duomenų rinkinių mediana yra vienoda. Abiejų langelių viduje esanti vertikali linija yra toje pačioje skaitmenų eilutės vietoje. Antrasis dalykas, kurį reikia atkreipti į dviejų langelių ir ūsų grafikus, yra tai, kad viršutinė brėžinė nėra tokia, kokia yra apačioje. Viršutinė dėžutė yra mažesnė, o ūsai nesikiša taip toli.

Nubrėžus du laukelių brėžinius virš tos pačios skaičių eilutės, tariama, kad duomenys, esantys už kiekvieno, verti palyginimo. Nebūtų prasmės lyginti trečiųjų greiderių aukščio dėžutės su šunų svoriu vietinėje prieglaudoje. Nors abiejuose yra santykiniai duomenys matavimo lygis, nėra jokios priežasties palyginti duomenis.

Kita vertus, būtų prasminga palyginti trečiųjų greiderių aukščių dėžes, jei tai vienas sklypas pavaizduoti duomenys apie berniukus mokykloje, o kitame sklype pateikti duomenys apie mergaites iš mokykla.

instagram story viewer