Kas yra histograma ir kaip ji naudojama?

Histograma yra grafiko rūšis, kurią galima plačiai naudoti statistikoje. Histogramos pateikia vaizdinį skaitiniai duomenys nurodant duomenų taškų, esančių reikšmių intervale, skaičių. Šie verčių diapazonai vadinami klasėmis arba šiukšliadėžėmis. Kiekvienoje klasėje esančių duomenų dažnis vaizduojamas naudojant juostą. Kuo aukštesnė juosta, tuo dažnesnės duomenų vertės toje šiukšliadėžėje.

Histogramos vs. Juostinės schemos

Iš pirmo žvilgsnio histogramos atrodo labai panašios į juostų grafikai. Abiejuose grafikuose pateikiamos vertikalios juostos. Juostos aukštis atitinka santykinis dažnis klasės duomenų kiekio. Kuo aukštesnė juosta, tuo didesnis duomenų dažnis. Kuo žemesnė juosta, tuo mažesnis duomenų dažnis. Tačiau išvaizda gali būti apgaulinga. Būtent čia ir baigiasi dviejų tipų grafikų panašumai.

Priežastis, kodėl šios diagramos yra skirtingos, turi priežastį duomenų matavimo lygis. Viena vertus, juostų grafikai naudojami duomenims esant nominaliam matavimo lygiui. Brėžinių diagramos išmatuokite kategorinių duomenų dažnį, o juostų diagramos klasės yra šios kategorijos. Kita vertus, histogramos naudojamos duomenims, kurių bent yra

instagram viewer
ordinarinis lygis matavimo. Histogramos klasės yra verčių intervalai.

Kitas svarbus brūkšnių diagramų ir histogramų skirtumas yra susijęs su juostų užsakymu. Brūkšninėje diagramoje įprasta juosteles pertvarkyti mažėjančio aukščio tvarka. Tačiau histogramos juostos negali būti pertvarkytos. Jie turi būti rodomi klasių sudarymo tvarka.

Histogramos pavyzdys

Aukščiau pateikta diagrama rodo mums histogramą. Tarkime, kad keturios monetos yra apverstos, o rezultatai užrašomi. Naudojimasis tinkamu dvinarė paskirstymo lentelė arba nesudėtingi skaičiavimai naudojant binominę formulę rodo tikimybę, kad nė viena galva nerodo, yra 1/16, tikimybė, kad rodoma viena galva, yra 4/16. Dviejų galvų tikimybė yra 6/16. Trijų galvų tikimybė yra 4/16. Keturių galvų tikimybė yra 1/16.

Iš viso statome penkias klases, kurių kiekvienos plotis yra vienas. Šios klasės atitinka galimą galvų skaičių: nulis, viena, dvi, trys ar keturios. Virš kiekvienos klasės nupiešiame vertikalią juostą arba stačiakampį. Šių strypų aukštis atitinka tikimybes, kurios buvo minėtos mūsų tikimybių eksperimentui apversti keturias monetas ir suskaičiuoti galvas.

Histogramos ir tikimybės

Aukščiau pateiktas pavyzdys ne tik demonstruoja histogramos sudarymą, bet ir parodo diskretiniai tikimybių pasiskirstymai gali būti pavaizduota histograma. Tiesą sakant, diskrečiąjį tikimybės pasiskirstymą galima pavaizduoti histograma.

Norėdami sukonstruoti histogramą, vaizduojančią tikimybių pasiskirstymą, pirmiausia pasirenkame klases. Tai turėtų būti tikimybės eksperimento rezultatai. Kiekvienos iš šių klasių plotis turėtų būti vienas vienetas. Histogramos juostų aukščiai yra kiekvieno išėjimo tikimybės. Jei histograma sudaryta tokiu būdu, juostų plotai taip pat yra tikimybės.

Kadangi tokia histograma suteikia mums tikimybių, jai taikoma keletas sąlygų. Viena išlyga yra ta, kad skalėje, suteikiančioje mums histogramos tam tikros juostos aukštį, galima naudoti tik neneigiamus skaičius. Antra sąlyga - kadangi tikimybė yra lygi plotui, visi juostų plotai turi sudaryti iš viso vieną, lygų 100%.

Histogramos ir kitos programos

Histogramos juostos nebūtinai turi būti tikimybės. Histogramos yra naudingos kitose srityse nei tikimybė. Bet kada, kai norime palyginti kiekybinių duomenų atsiradimo dažnį, histograma gali būti naudojama mūsų duomenų rinkiniui pavaizduoti.