Pasitikėjimo intervalas dviejų gyventojų proporcijų skirtumui

Pasitikėjimo intervalai yra viena iš įtaigi statistika. Pagrindinė šios temos idėja yra įvertinti nežinomos populiacijos vertę parametras naudojant statistinę imtį. Mes galime ne tik įvertinti parametro vertę, bet taip pat galime pritaikyti savo metodus, kad įvertintume dviejų susijusių parametrų skirtumą. Pvz., Galbūt norėsime sužinoti, koks yra procentas vyrų, balsuojančių iš JAV, procentų, kurie palaiko tam tikrą teisės aktą, palyginti su moterimis, balsuojančiomis balsavusiais.

Pamatysime, kaip atlikti tokio tipo skaičiavimus, sukonstravus patikimumo intervalą dviejų populiacijų proporcijų skirtumui. Proceso metu išnagrinėsime kai kurias šio skaičiavimo teorijas. Pamatysime keletą panašumų, kaip mes konstruojame a Pasitikėjimo intervalas vienai gyventojų daliai taip pat a pasikliautinasis intervalas dviejų gyventojų skirtumų vidurkiui.

Bendrosios nuostatos

Prieš pažvelgdami į konkrečią formulę, kurią naudosime, panagrinėkime bendrą struktūrą, kuriai tinka šio tipo pasitikėjimo intervalas. Pasitikėjimo intervalo tipo formą, į kurią mes žiūrėsime, gaunama pagal šią formulę:

instagram viewer

Įvertinkite +/- klaidos ribą

Daugelis pasitikėjimo intervalų yra šio tipo. Yra du skaičiai, kuriuos turime apskaičiuoti. Pirmoji iš šių verčių yra parametro sąmata. Antroji vertė yra paklaida. Ši klaidų riba yra susijusi su tuo, kad mes turime sąmatą. Pasitikėjimo intervalas suteikia mums nežinomų parametrų galimų verčių diapazoną.

Sąlygos

Prieš atlikdami skaičiavimus, turėtume įsitikinti, kad visos sąlygos yra įvykdytos. Norėdami rasti patikimumo intervalą dviejų populiacijų proporcijų skirtumui, turime įsitikinti, kad išlaikoma:

  • Mes turime du paprasti atsitiktiniai pavyzdžiai iš didelių populiacijų. Čia „didelis“ reiškia, kad populiacija yra mažiausiai 20 kartų didesnė už imtį. Imties dydžiai bus žymimi n1 ir n2.
  • Mūsų asmenys buvo pasirinkti nepriklausomai vienas nuo kito.
  • Kiekviename iš mūsų pavyzdžių yra bent dešimt sėkmių ir dešimt nesėkmių.

Jei paskutinis sąrašo punktas nėra patenkintas, gali būti, kad taip bus. Mes galime modifikuoti plius keturi pasitikėjimo intervalai statyba ir gavimas patikimi rezultatai. Eidami į priekį manome, kad visos minėtos sąlygos buvo įvykdytos.

Mėginiai ir populiacijos proporcijos

Dabar esame pasirengę nustatyti savo pasitikėjimo intervalą. Mes pradedame nuo mūsų gyventojų proporcijų skirtumo įvertinimo. Abi šios populiacijos proporcijos yra įvertintos imties proporcija. Šios imties proporcijos yra statistika, randama padalijus kiekvienos imties sėkmės skaičių ir padalinus iš atitinkamo imties dydžio.

Pirmoji gyventojų dalis žymima p1. Jei šios populiacijos pavyzdžių skaičius yra lygus k1, tada turime mėginio proporciją k1 / n1.

Šią statistiką žymime p̂1. Mes skaitome šį simbolį kaip „p1-tai “, nes atrodo kaip simbolis p1 su kepure viršuje.

Panašiu būdu mes galime apskaičiuoti imties dalį iš antrosios populiacijos. Šios populiacijos parametras yra p2. Jei šios populiacijos pavyzdžių skaičius yra lygus k2, o mūsų imties dalis yra p̂2 = k2 / n2.

Šios dvi statistikos tampa pirmąja mūsų pasitikėjimo intervalo dalimi. Sąmata p1 yra p̂1. Sąmata p2 yra p̂2. Taigi skirtumo įvertinimas p1 - p2 yra p̂1 - p̂2.

Mėginių proporcijų skirtumų atranka

Toliau turime gauti klaidos ribos formulę. Norėdami tai padaryti, pirmiausia apsvarstysime: imties paskirstymas iš p̂1 . Tai yra binominis pasiskirstymas su sėkmės tikimybe p1 ir n1 bandymai. Šio paskirstymo vidurkis yra proporcija p1. Šio tipo atsitiktinių kintamųjų standartinis nuokrypis turi dispersiją p1 (1 - p1 )/n1.

P̂ atrankos pasiskirstymas2 yra panašus į p̂1 . Paprasčiausiai pakeiskite visus indeksus nuo 1 iki 2 ir mes turime binominį pasiskirstymą, kurio vidurkis p2 ir dispersija p2 (1 - p2 )/n2.

Dabar reikia kelių matematinės statistikos rezultatų, kad būtų galima nustatyti p̂ atrankos pasiskirstymą1 - p̂2. Šio paskirstymo vidurkis yra p1 - p2. Kadangi dispersijos susideda, matome, kad atrankos pasiskirstymo dispersija yra p1 (1 - p1 )/n1 + p2 (1 - p2 )/n2. Standartinis paskirstymo nuokrypis yra šios formulės kvadratinė šaknis.

Yra keletas pakeitimų, kuriuos turime atlikti. Pirmasis yra tas, kad standartinio nuokrypio p̂ formulė1 - p̂2 naudoja nežinomus parametrus p1 ir p2. Be abejo, jei mes tikrai žinotume šias vertybes, tai visai nebūtų įdomi statistinė problema. Mums nereikėtų vertinti skirtumo tarp p1 ir p2.. Vietoj to, mes tiesiog galėtume apskaičiuoti tikslų skirtumą.

Šią problemą galima išspręsti apskaičiuojant standartinę paklaidą, o ne standartinį nuokrypį. Viskas, ką mums reikia padaryti, yra pakeisti populiacijos proporcijas imties proporcijomis. Standartinės klaidos apskaičiuojamos pagal statistiką, o ne parametrus. Standartinė paklaida yra naudinga, nes ji efektyviai nustato standartinį nuokrypį. Tai reiškia, kad mums nebereikia žinoti parametrų vertės p1 ir p2. .Kadangi šios imties proporcijos yra žinomos, standartinė paklaida nurodoma pagal šios išraiškos kvadratinę šaknį:

1 (1 - p̂1 )/n1 + p̂2 (1 - p̂2 )/n2.

Antrasis punktas, kurį turime išspręsti, yra konkreti atrankos paskirstymo forma. Pasirodo, kad apytikslį p the atrankos pasiskirstymą galime naudoti normalųjį pasiskirstymą1 - p̂2. To priežastis yra šiek tiek techninė, tačiau ji aprašyta kitame punkte.

Tiek p̂1 ir p̂2 turėti atrankos pasiskirstymą, kuris yra binominis. Kiekvieną iš šių dvinarių pasiskirstymų galima gana gerai apytiksliai palyginti su normaliu pasiskirstymu. Taigi p̂1 - p̂2 yra atsitiktinis kintamasis. Jis suformuotas kaip linijinis dviejų atsitiktinių kintamųjų derinys. Kiekvienas iš jų yra apytiksliai paskirstytas. Todėl p̂ atrankos pasiskirstymas1 - p̂2 taip pat paprastai pasiskirsto.

Pasitikėjimo intervalo formulė

Dabar turime viską, ko reikia, kad nustatytume pasitikėjimo intervalą. Įvertinimas yra (p̂1 - p̂2), o paklaidos riba yra z * [p̂1 (1 - p̂1 )/n1 + p̂2 (1 - p̂2 )/n2.]0.5. Vertė, kurią įvedame z * yra padiktuotas pasitikėjimo lygiu C. Dažniausiai naudojamos reikšmės z * yra 1,645 (pasitikėjimas 90%) ir 1,96 (95%). Šios vertės z * žymi standartinio normaliojo paskirstymo dalį ten, kur tiksliai C procentų paskirstymo yra tarp -z * ir z *.

Ši formulė suteikia mums patikimumo intervalą dviejų populiacijų proporcijų skirtumui:

(p̂1 - p̂2) +/- z * [p̂1 (1 - p̂1 )/n1 + p̂2 (1 - p̂2 )/n2.]0.5

instagram story viewer