Variacijos patikimumo intervalo pavyzdys

Gyventojų skaičiaus kitimas nurodo, kaip paskirstyti duomenis. Deja, paprastai neįmanoma tiksliai žinoti, koks yra šis populiacijos parametras. Norėdami kompensuoti mūsų žinių trūkumą, naudojame temą iš įgimtos statistikos, vadinamą pasitikėjimo intervalai. Pamatysime pavyzdį, kaip apskaičiuoti pasitikėjimo intervalą, atsižvelgiant į populiacijos dispersiją.

Pasitikėjimo intervalo formulė

(1 - α) formulė Pasitikėjimo intervalas apie populiacijos dispersiją. Skiriama pagal šią nelygybės eilutę:

[ (n - 1)s2] / B < σ2 < [ (n - 1)s2] / A.

Čia n yra imties dydis, s2 yra imties dispersija. Skaičius A yra chi-kvadrato pasiskirstymo taškas su n -1 laisvės laipsniai, kai tiksliai α / 2 ploto po kreive yra kairėje nuo A. Panašiu būdu skaičius B yra to paties chi-kvadrato pasiskirstymo taškas su tiksliai α / 2 ploto po kreivės dešinėje B.

Preliminarios programos

Pradedame nuo 10 verčių duomenų rinkinio. Šis duomenų verčių rinkinys buvo gautas atlikus paprastą atsitiktinę imtį:

97, 75, 124, 106, 120, 131, 94, 97,96, 102

instagram viewer

Reikėtų atlikti tam tikrą tiriamųjų duomenų analizę, norint parodyti, kad nėra pašalinių duomenų. Konstruodamas a stiebo ir lapų sklypas matome, kad šie duomenys yra tikėtini iš paskirstymo, kuris yra beveik įprastai paskirstomas. Tai reiškia, kad galime tęsti 95% pasikliautinąjį intervalą, atsižvelgiant į populiacijos dispersiją.

Imties dispersija

Turime įvertinti populiacijos dispersiją su imties dispersija, žymima s2. Taigi mes pradedame skaičiuoti šią statistiką. Iš esmės mes apskaičiuojame vidurkį kvadratinių nuokrypių suma nuo vidurkio. Tačiau užuot daliję šią sumą iš n mes ją padalijame iš n - 1.

Mes nustatėme, kad imties vidurkis yra 104,2. Naudodamiesi šia reikšme, gauname kvadratinių nuokrypių nuo vidurkio sumą:

(97 – 104.2)2 + (75 – 104.3)2 +... + (96 – 104.2)2 + (102 – 104.2)2 = 2495.6

Padaliname šią sumą iš 10 - 1 = 9, kad gautume 277 mėginio dispersiją.

Chi-kvadrato pasiskirstymas

Dabar mes kreipiamės į mūsų chi-square paskirstymą. Kadangi turime 10 duomenų verčių, turime 9 laisvės laipsniai. Kadangi norime, kad vidurkis būtų 95% mūsų paskirstymo, mums reikia 2,5% kiekvienoje iš dviejų uodegų. Mes ieškome chi-square lentelės ar programinės įrangos ir matome, kad lentelių reikšmės 2.7004 ir 19.023 apima 95% platinimo ploto. Šie skaičiai yra A ir B, atitinkamai.

Dabar turime viską, ko mums reikia, ir esame pasirengę nustatyti savo pasitikėjimo intervalą. Kairiojo galinio taško formulė yra [(n - 1)s2] / B. Tai reiškia, kad mūsų kairioji baigtis yra:

(9 x 277) / 19,023 = 133

Tinkamas galinis taškas randamas pakeičiant B su A:

(9 x 277) / 2,7004 = 923

Taigi 95% esame įsitikinę, kad populiacijos kitimas yra nuo 133 iki 923.

Gyventojų standartinis nuokrypis

Žinoma, kadangi standartinis nuokrypis yra dispersijos kvadratinė šaknis, šis metodas galėtų būti naudojamas apskaičiuojant populiacijos standartinio nuokrypio pasikliautinąjį intervalą. Viskas, ką mums reikės padaryti, yra paimti kvadratines galinių taškų šaknis. Rezultatas būtų 95% pasikliautinasis intervalas standartinis nuokrypis.