Statistinių duomenų rinkinių diapazonas

Statistikos ir matematikos srityse diapazonas yra skirtumas tarp didžiausių ir mažiausių duomenų rinkinio verčių ir tarnauja kaip viena iš dviejų svarbių duomenų rinkinio savybių. Diapazono reikšmė yra didžiausia reikšmė atėmus mažiausią duomenų rinkinio vertę, kuri statistikams suteikia galimybę geriau suprasti, koks yra duomenų rinkinio kitimas.

Du svarbūs duomenų rinkinio bruožai yra duomenų centras ir duomenų sklaida, o centras gali būtimatuojama įvairiais būdais: populiariausi iš jų yra vidurkis, mediana, režimas ir vidutinis diapazonas, tačiau panašiai yra ir skirtingais būdais apskaičiuoti, koks yra duomenų rinkinio paskirstymas, o lengviausias ir grubiausias sklaidos matas vadinamas diapazonu.

Diapazonas apskaičiuojamas labai nesudėtingai. Viskas, ką mums reikia padaryti, tai rasti skirtumą tarp didžiausios mūsų rinkinio duomenų vertės ir mažiausios duomenų vertės. Trumpai tariant, mes turime šią formulę: Diapazonas = Didžiausia vertė – Mažiausia vertė. Pavyzdžiui, duomenų rinkinyje 4,6,10, 15, 18 yra ne daugiau kaip 18, mažiausiai 4 ir diapazonas 18-4 = 14.

instagram viewer

Diapazonas yra labai neapdorotas duomenų plitimo matas, nes jis yra ypač jautrus pašalinėms vertėms ir dėl to yra tam tikrų tikros statistikos duomenų diapazono naudingumo statistikams apribojimai, nes viena duomenų vertė gali labai paveikti diapazonas.

Pavyzdžiui, apsvarstykite 1, 2, 3, 4, 6, 7, 7, 8 duomenų rinkinį. Didžiausia vertė yra 8, mažiausia - 1, o diapazonas - 7. Tada apsvarstykite tą patį duomenų rinkinį, tik įtraukdami reikšmę 100. Diapazonas dabar tampa 100-1 = 99 kur pridėjus vieną papildomą duomenų tašką, smarkiai paveikta diapazono vertė. Standartinis nuokrypis yra dar viena sklaidos priemonė, mažiau jautri pašalinėms vertėms, tačiau trūkumas yra tas, kad standartinio nuokrypio apskaičiavimas yra daug sudėtingesnis.

Diapazonas taip pat nieko nesako apie vidines mūsų duomenų rinkinio ypatybes. Pvz., Mes laikome 1, 1, 2, 3, 4, 5, 5, 6, 7, 8, 8, 10 duomenų rinkinį, kur yra šio duomenų rinkinio diapazonas. 10-1 = 9. Jei palyginsime tai su 1, 1, 1, 2, 9, 9, 9, 10 duomenų rinkiniu. Diapazonas vėlgi yra devyni, tačiau šiam antrajam rinkiniui duomenys, skirtingai nuo pirmojo rinkinio, yra suskirstyti į mažiausią ir maksimalų. Norint aptikti dalį šios vidinės struktūros, reikėtų naudoti kitą statistiką, tokią kaip pirmasis ir trečiasis kvartilis.

Diapazonas yra geras būdas gauti labai pagrindinį supratimą apie tai, kaip iš tikrųjų paskirstomi skaičiai duomenų rinkinyje, nes tai lengva padaryti Apskaičiuokite, nes tam reikia tik pagrindinės aritmetinės operacijos, tačiau yra ir keletas kitų duomenų rinkinio diapazono programų. statistika.

Diapazonas taip pat gali būti naudojamas įvertinti kitą sklaidos dydį - standartinį nuokrypį. Užuot naudojęsi gana sudėtinga formule norėdami rasti standartinį nuokrypį, mes galime naudoti tai, kas vadinama diapazono taisyklė. Diapazonas yra pagrindinis atliekant šį skaičiavimą.

Diapazonas taip pat būna a boxplot, arba dėžutė ir ūsai sklypas. Maksimalios ir mažiausios vertės nubraižomos grafiko ūsų pabaigoje, o bendras ūsų ir langelio ilgis yra lygus diapazonui.