Kas yra tarpkvartilinė diapazono taisyklė?

Tarpkvartilinio diapazono taisyklė yra naudinga nustatant pašalinių reiškinių buvimą. Nuokrypiai yra atskiros vertės, nepatenkančios į bendrą duomenų rinkinio modelį. Šis apibrėžimas yra šiek tiek neaiškus ir subjektyvus, todėl naudinga turėti taisyklę, kuri būtų taikoma, kada nustatyti, ar duomenų taškas tikrai yra pašalinis - tai yra tarpkalbinių diapazono taisyklė ateina.

Bet kurį duomenų rinkinį galima apibūdinti tuo penkių skaičių santrauka. Šie penki skaičiai, suteikiantys jums informacijos, reikalingos norint rasti modelius ir nuokrypius, susideda iš (didėjančia tvarka):

Šie penki skaičiai pasako daugiau asmeniui apie jų duomenis, nei žvelgiant į visus numerius vienu metu galėtų ar bent jau palengvintų tai. Pavyzdžiui, diapazonas, kuris yra mažiausias atimamas iš didžiausio, yra vienas iš duomenų pasiskirstymo aibėje rodiklio (pastaba: diapazonas yra labai didelis jautrus pašalinėms vertėms - jei pašalinis dydis taip pat yra minimalus ar maksimalus, diapazonas nebus tikslus duomenų pločio pavaizdavimas rinkinys).

instagram viewer

Asortimentą sunku būtų ekstrapoliuoti kitaip. Tarpkvartilinis diapazonas yra panašus į diapazoną, bet mažiau jautrus pašalinėms vertėms. tarpkvartalinis diapazonas apskaičiuojamas panašiai kaip diapazonas. Viskas, ką jūs norite rasti, atimkite pirmąjį kvartilį iš trečiojo kvartilio:

Tarpkvartalinis diapazonas parodo, kaip pasiskirstomi duomenys apie mediana. Jis yra mažiau jautrus nei diapazonas pašaliniams rodikliams, todėl gali būti naudingesnis.

Nors jiems dažnai tai nedaro didelės įtakos, tarpkvartilinis diapazonas gali būti naudojamas nuokrypiams nustatyti. Tai atliekama atlikus šiuos veiksmus:

Atminkite, kad keturkampio taisyklė yra tik nykščio taisyklė, kuri paprastai galioja, bet netaikoma visais atvejais. Apskritai, visada turėtumėte sekti savo pašalinę analizę, ištyrę gautus pašalinius duomenis ir įsitikinkite, ar jie turi prasmę. Bet koks galimas išorinių efektų, gautų tarpkvartilio metodu, vertinimas turėtų būti atliekamas atsižvelgiant į visą duomenų rinkinį.

Žr. Tarpkvartalių diapazono taisyklę darbe su pavyzdžiu. Tarkime, kad turite šį duomenų rinkinį: 1, 3, 4, 6, 7, 7, 8, 8, 10, 12, 17. Šio duomenų rinkinio penkių skaičių suvestinė yra mažiausiai = 1, pirmasis kvartilis = 4, mediana = 7, trečioji kvartilė = 10 ir daugiausiai = 17. Galite pažvelgti į duomenis ir automatiškai pasakyti, kad 17 yra išeitis, bet ką sako tarpkvartilinės diapazono taisyklė?

Padauginkite savo atsakymą iš 1,5, kad gautumėte 1,5 x 6 = 9. Devyni mažiau nei pirmasis kvartilis yra 4 - 9 = -5. Jokių duomenų yra mažiau. Devyni daugiau nei trečiasis kvartilis yra 10 + 9 = 19. Jokių duomenų yra daugiau. Nepaisant maksimalios vertės, kuri yra penki daugiau nei artimiausias duomenų taškas, interkvartilinio diapazono taisyklė rodo, kad ji greičiausiai neturėtų būti laikoma pašaline šiam duomenų rinkiniui.