Standartinis nuokrypis ir diapazonas yra abu parametrai duomenų rinkinio plitimas. Kiekvienas skaičius savaip nurodo, koks yra duomenų išsidėstymas, nes jie abu yra variacijos matas. Nors nėra aiškaus ryšio tarp diapazonas ir standartinis nuokrypis, čia yra nykščio taisyklė kad gali būti naudinga susieti šias dvi statistikas. Šis santykis kartais vadinamas standartinio nuokrypio diapazono taisykle.
Diapazono taisyklė nurodo, kad imties standartinis nuokrypis yra maždaug lygus ketvirtadaliui duomenų diapazono. Kitaip tariants = (Didžiausias - mažiausias) / 4. Tai labai nesudėtinga formulė, kurią reikėtų naudoti tik kaip labai neapdorotą standartinio nuokrypio įvertinimas.
Pavyzdys
Norėdami pamatyti pavyzdį, kaip veikia diapazono taisyklė, pažvelgsime į šį pavyzdį. Tarkime, pradėsime nuo 12, 12, 14, 15, 16, 18, 18, 20, 20, 25 duomenų verčių. Šios vertybės turi a reiškia 17 ir standartinis nuokrypis apie 4,1. Jei vietoj to pirmiausia apskaičiuotume, kad mūsų duomenų diapazonas yra 25 - 12 = 13 ir tada padalykite šį skaičių iš keturių. Standartinį nuokrypį įvertiname kaip 13/4 = 3,25. Šis skaičius yra gana artimas tikrajam standartiniam nuokrypiui ir tinka apytiksliai apskaičiuoti.
Kodėl tai veikia?
Gali atrodyti, kad diapazono taisyklė yra šiek tiek keista. Kodėl tai veikia? Ar neatrodo visiškai savavališka padalyti intervalą iš keturių? Kodėl mes negalėtume padalyti iš kito skaičiaus? Užkulisiuose iš tikrųjų yra tam tikras matematinis pagrindimas.
Prisiminkite varpo kreivė ir tikimybes iš a standartinis normalus pasiskirstymas. Viena ypatybė yra susijusi su duomenų kiekiu, patenkančiu į tam tikrą skaičių standartinių nuokrypių:
- Maždaug 68% duomenų yra per standartinį (didesnį ar mažesnį) nuokrypį nuo vidurkio.
- Maždaug 95% duomenų yra dviejų standartinių (didesnių ar mažesnių) nuokrypių nuo vidurkio.
- Maždaug 99% yra trijų standartinių (didesnių ar mažesnių) nuokrypių nuo vidurkio.
Skaičius, kurį naudosime, bus susijęs su 95 proc. Galime pasakyti, kad 95% dviejų standartinių nuokrypių, mažesnių už vidurkį, iki dviejų standartinių nuokrypių, viršijančių vidurkį, mes turime 95% savo duomenų. Taigi beveik visas įprastas mūsų pasiskirstymas išsikištų per linijos segmentą, kuris iš viso yra keturių standartinių nuokrypių.
Ne visi duomenys paprastai paskirstomi ir yra varpelio kreivės formos. Tačiau dauguma duomenų yra pakankamai gerai elgiamasi, kad beveik du duomenys užfiksuojami dviem standartiniais nuokrypiais nuo vidurkio. Įvertiname ir sakome, kad keturi standartiniai nuokrypiai yra maždaug diapazono dydžio, todėl diapazonas, padalytas iš keturių, yra apytikslis standartinio nuokrypio apytikslis dydis.
Panaudojimas diapazono taisyklei
Diapazono taisyklė naudinga keliuose nustatymuose. Pirma, tai labai greitas standartinio nuokrypio įvertinimas. Standartinis nuokrypis reikalauja, kad pirmiausia surastume vidurkį, tada atimtume šį vidurkį iš kiekvieno duomenų taško, kvadrato skirtumus, pridėkite juos, padalinkite iš vieno mažesnio nei duomenų taškų skaičius, tada (pagaliau) užimkite kvadratą šaknis. Kita vertus, diapazono taisyklei reikia tik vieno atimties ir vieno padalijimo.
Kitos vietos, kur naudinga diapazono taisyklė, yra tada, kai turime neišsamią informaciją. Tokioms formulėms, kaip kad būtų galima nustatyti mėginio dydį, reikia trijų informacijos dalių: norimos paklaidos riba, pasitikėjimo lygis ir standartinis gyventojų, kuriuos tiriame, nuokrypis. Daugybę kartų neįmanoma žinoti, kokie yra gyventojai standartinis nuokrypis yra. Taikydami diapazono taisyklę, mes galime įvertinti šią statistiką ir tada žinoti, kiek mes turėtume sudaryti mūsų imties.