Pasitikėjimo intervalai gali būti naudojamas kelių gyventojų skaičiui įvertinti parametrus. Vieno tipo parametrai, kuriuos galima įvertinti naudojant įtaigi statistika yra gyventojų proporcija. Pvz., Galbūt norėsime sužinoti, kokia procentinė dalis JAV gyventojų palaiko tam tikrą teisės aktą. Tokio tipo klausimams turime rasti pasitikėjimo intervalą.
Šiame straipsnyje pamatysime, kaip sudaryti pasitikėjimo intervalą populiacijos daliai, ir išnagrinėsime kai kurias teorijas.
Bendra sistema
Prieš pradėdami gilintis į specifiką, pirmiausia pažvelkime į didelį vaizdą. Pasitikėjimo intervalo tipas, kurį mes atsižvelgsime, yra šios formos:
Įvertinkite +/- klaidos ribą
Tai reiškia, kad turėsime nustatyti du skaičius. Šios vertės yra norimo parametro įvertinimas kartu su paklaida.
Sąlygos
Prieš atliekant bet kurį statistinį testą ar procedūrą, svarbu įsitikinti, ar laikomasi visų sąlygų. Norėdami nustatyti gyventojų santykio patikimumo intervalą, turime įsitikinti, kad:
- Mes turime paprasta atsitiktinė imtis dydžio n iš gausios populiacijos
- Mūsų asmenys buvo pasirinkti nepriklausomai vienas nuo kito.
- Mūsų atrankoje yra bent 15 pasisekimų ir 15 nesėkmių.
Jei paskutinis elementas nėra patenkintas, gali būti įmanoma šiek tiek pakoreguoti mūsų imtį ir naudoti a plius keturi pasitikėjimo intervalai. Toliau darysime prielaidą, kad visos minėtos sąlygos buvo įvykdytos.
Imties ir populiacijos proporcijos
Mes pradedame nuo mūsų gyventojų proporcijos įvertinimo. Lygiai taip pat, kaip populiacijos vidurkį įvertiname imties vidurkį, populiacijos proporcijai įvertinti naudojame imties proporciją. Populiacijos santykis yra nežinomas parametras. Imties dalis yra statistika. Ši statistika randama suskaičiavus pavyzdžių pavyzdžių skaičių mūsų imtyje ir padalinus iš bendro imties individų skaičiaus.
Gyventojų dalis žymima p ir yra savaime suprantamas. Šiek tiek labiau atsižvelgiama į imties proporciją. Mėginio dalį žymime kaip p̂, o šį simbolį skaitome kaip „p-skrybėlę“, nes jis atrodo kaip raidė p su kepure viršuje.
Tai tampa pirmąja mūsų pasitikėjimo intervalo dalimi. Įvertinimas p yra p̂.
Mėginių proporcijos pasiskirstymas imtyje
Norėdami nustatyti klaidos ribos formulę, turime galvoti apie imties paskirstymas iš p̂. Turėsime žinoti vidurkį, standartinį nuokrypį ir konkretų pasiskirstymą, su kuriuo mes dirbame.
P̂ atrankos pasiskirstymas yra binominis pasiskirstymas su sėkmės tikimybe p ir n bandymai. Šio tipo atsitiktinių kintamųjų vidurkis yra p ir standartinis nuokrypis (p(1 - p)/n)0.5. Su tuo susijusios dvi problemos.
Pirma problema yra tai, kad su binominiu paskirstymu dirbti gali būti labai sudėtinga. Faktorių buvimas gali sukelti labai daug. Čia sąlygos mums padeda. Kol bus įvykdytos mūsų sąlygos, mes galime įvertinti binominį pasiskirstymą su standartiniu normaliuoju pasiskirstymu.
Antra problema yra ta, kad naudojamas p̂ standartinis nuokrypis p jo apibrėžime. Nežinomas populiacijos parametras turi būti įvertintas naudojant tą patį parametrą kaip paklaidos ribą. Šis apskritas samprotavimas yra problema, kurią reikia išspręsti.
Išeitis iš šios keblybės yra pakeisti standartinį nuokrypį jo standartine paklaida. Standartinės klaidos yra pagrįstos statistika, o ne parametrais. Standartiniam nuokrypiui įvertinti naudojama standartinė paklaida. Ši strategija pasiteisina tuo, kad mums nebereikia žinoti parametro vertės p.
Formulė
Norėdami naudoti standartinę klaidą, pakeičiame nežinomą parametrą p su statistine p̂. Rezultatas yra toks, remiantis gyventojų skaičiaus pasikliovimo intervalo formule:
p̂ +/- z * (p̂ (1 - p̂) /n)0.5.
Čia vertė z * lemia mūsų pasitikėjimo lygis C. Tiksliai standartiniam paskirstymui C % normalaus normaliojo pasiskirstymo yra tarp -z * ir z *. Bendros z * įtraukite 1,645, kai pasitikėjimas 90 proc., ir 1,96, jei pasitikėjimas 95 proc.
Pavyzdys
Pažiūrėkime, kaip šis metodas veikia su pavyzdžiu. Tarkime, kad norime 95 proc. Pasitikėjimo sužinoti rinkėjų procentą apskrityje, kuri save laiko demokratine. Mes atliekame paprastą atsitiktinę 100 apskrities žmonių imtį ir pastebime, kad 64 iš jų yra demokratai.
Matome, kad visos sąlygos yra įvykdytos. Apskaičiuota, kad mūsų gyventojų dalis yra 64/100 = 0,64. Tai yra imties proporcijos p̂ reikšmė ir yra mūsų pasitikėjimo intervalo centras.
Klaidą sudaro dvi dalys. Pirmasis yra z*. Kaip mes sakėme, kad 95% pasitikėjimo verte z* = 1.96.
Kita paklaidos ribos dalis yra apskaičiuojama pagal formulę (p̂ (1 - p̂) /n)0.5. Mes nustatome p̂ = 0,64 ir apskaičiuojame = standartinė paklaida turi būti (0,64 (0,36) / 100)0.5 = 0.048.
Padauginame šiuos du skaičius kartu ir gauname 0,09408 paklaidos ribą. Galutinis rezultatas yra toks:
0.64 +/- 0.09408,
arba galime tai perrašyti kaip 54,592% iki 73,408%. Taigi mes esame 95% įsitikinę, kad tikroji demokratų dalis yra kažkur tarp šių procentų. Tai reiškia, kad ilgainiui mūsų technika ir formulė užfiksuos 95% gyventojų skaičiaus.
Susijusios idėjos
Yra keletas idėjų ir temų, susijusių su šio tipo pasitikėjimo intervalu. Pavyzdžiui, mes galime atlikti hipotezės testą, susijusį su gyventojų dalies verte. Taip pat galėtume palyginti dvi proporcijas iš dviejų skirtingų populiacijų.