Į statistika, yra daug terminų, turinčių subtilų skirtumą. Vienas iš pavyzdžių yra skirtumas tarp dažnis ir santykinis dažnis. Nors santykinius dažnius galima naudoti daug, ypač yra santykinio dažnio histograma. Tai grafiko tipas, turintis ryšį su kitomis statistikos ir matematinės statistikos temomis.
Apibrėžimas
Histogramos yra statistiniai grafikai, kurie atrodo kaip juostų grafikai. Paprastai terminas histograma yra skirtas kiekybinis kintamieji. Horizontalioji histogramos ašis yra skaičių eilutė, kurioje yra klases arba vienodo ilgio šiukšliadėžės. Šios dėžės yra skaičių eilutės intervalai, kai duomenys gali nukristi, ir juos gali sudaryti vienas skaičius (paprastai diskretus duomenų rinkiniai, kurie yra palyginti maži) arba verčių diapazonas (didesniems atskiram duomenų rinkiniui ir tęstinis duomenys).
Pvz., Mums gali būti įdomu įvertinti balų paskirstymą 50 balų viktorinoje mokinių klasei. Vienas iš galimų šiukšliadėžių konstravimo būdų būtų kiekviename 10 taškų turėti skirtingą šiukšliadėžę.
Vertikali histogramos ašis rodo skaičių arba dažnį, kurį kiekvienoje dėžėje turi duomenų vertė. Kuo aukštesnė juosta, tuo daugiau duomenų verčių patenka į šį šiukšliadėžės verčių diapazoną. Grįžtant prie mūsų pavyzdžio, jei esame penki studentai, kurie viktorinoje surinko daugiau nei 40 taškų, tada juosta, atitinkanti 40–50 šiukšliadėžę, bus penki vienetai.
Dažnio histogramos palyginimas
Santykinio dažnio histograma yra nedidelė tipinės dažnio histogramos modifikacija. Užuot naudodami vertikalią ašį duomenų verčių, patenkančių į tam tikrą šiukšliadėžę, skaičiavimui, mes naudojame šią ašį, norėdami parodyti bendrą duomenų verčių, patenkančių į šią šiukšliadėžę, dalį. Kadangi 100% = 1, visų juostų aukštis turi būti nuo 0 iki 1. Be to, visų juostų aukščiai mūsų santykinės dažnio histogramoje turi būti 1.
Taigi, tarkime, kad mūsų pateiktame pavyzdyje mūsų klasėje yra 25 mokiniai ir penki surinko daugiau nei 40 taškų. Užuot statę šiai šiukšliadėžei penkių aukščių juostą, turėtume juostą, kurios aukštis 5/25 = 0,2.
Palyginę histogramą su santykinio dažnio histograma, kiekviena su tomis pačiomis dėžėmis, mes ką nors pastebėsime. Bendra histogramų forma bus vienoda. Santykinio dažnio histograma neišryškina bendro kiekvienos šiukšliadėžės skaičiaus. Vietoj to, šio tipo diagramose dėmesys sutelkiamas į tai, kaip duomenų verčių skaičius šiukšliadėžėje susijęs su kitomis dėžėmis. Šis santykis rodomas procentais nuo bendro duomenų verčių skaičiaus.
Tikimybių masinės funkcijos
Mums gali kilti klausimas, kokia yra apibrėžus santykinio dažnio histogramą. Vienas pagrindinis taikymas yra susijęs su atskirais atsitiktiniais kintamaisiais, kai mūsų dėžės yra vienos pločio ir yra sutelktos ties kiekvienu neneigiamuoju sveiku skaičiumi. Tokiu atveju mes galime apibrėžti funkciją dalimis su vertėmis, atitinkančiomis vertikalius juostų aukščius mūsų santykinio dažnio histogramoje.
Šis funkcijos tipas vadinamas tikimybine masės funkcija. Funkcijos konstravimo tokiu būdu priežastis yra ta, kad funkcijos apibrėžta kreivė turi tiesioginį ryšį su tikimybė. Plotas po kreive nuo verčių a į b yra tikimybė, kad atsitiktinio kintamojo vertė yra nuo a į b.
Tikimybės ir kreivės srities ryšys yra tas, kuris pakartotinai parodytas matematinėje statistikoje. Kitas toks ryšys yra santykinės dažnio histogramos modeliavimas naudojant tikimybės masės funkciją.