Pasitikėjimo intervalai: 4 bendros klaidos

click fraud protection

Pasitikėjimo intervalai yra pagrindinė įtaigios statistikos dalis. Mes galime naudoti tam tikrą tikimybę ir informaciją iš a tikimybės pasiskirstymas įvertinti populiacijos parametrą naudojant imtį. Teiginys pasitikėjimo intervalas yra padaryta taip, kad būtų lengvai nesuprantama. Mes pažvelgsime į teisingą pasitikėjimo intervalų aiškinimą ir ištirsime keturias klaidas, padarytas šioje statistikos srityje.

Kas yra pasitikėjimo intervalas?

Pasikliautinasis intervalas gali būti išreikštas kaip verčių diapazonas arba tokia forma:

Įvertinkite ± Klaidos riba

Pasitikėjimo intervalas paprastai nurodomas su pasitikėjimo lygiu.Bendras pasitikėjimo lygis yra 90%, 95% ir 99%.

Pažvelgsime į pavyzdį, kai norime panaudoti imties vidurkį, norėdami nustatyti populiacijos vidurkį. Tarkime, kad tai lemia pasikliovimo intervalą nuo 25 iki 30. Jei sakome, kad esame 95% įsitikinę, kad nežinoma populiacija reiškia yra šiame intervale, tada mes tikrai sakome, kad intervalą radome naudodami metodą, kuris sėkmingai suteikia teisingus rezultatus 95% laiko. Ilgainiui mūsų metodas bus nesėkmingas 5% laiko. Kitaip tariant, mums nepavyks užfiksuoti tikrosios populiacijos, ty tik vienos iš 20 kartų.

instagram viewer

1 klaida

Dabar panagrinėsime daugybę skirtingų klaidų, kurios gali būti padarytos nagrinėjant pasitikėjimo intervalus. Vienas neteisingas teiginys, dažnai sakomas apie 95% pasikliovimo intervalą, yra 95% tikimybė, kad pasitikėjimo intervale yra tikrasis gyventojų vidurkis.

Priežastis, kad tai yra klaida, iš tikrųjų yra gana subtili. Pagrindinė pasitikėjimo intervalo idėja yra ta, kad naudojama tikimybė patenka į paveikslėlį metodas, kuris naudojamas nustatant pasitikėjimo intervalą, yra tas, kad jis nurodo metodą, kuris yra naudotas.

2 klaida

Antra klaida yra aiškinti 95% pasikliovimo intervalą kaip sakančią, kad 95% visų gyventojų duomenų verčių patenka į intervalą. Vėlgi, 95% pasisako už bandymo metodą.

Norėdami sužinoti, kodėl aukščiau pateiktas teiginys yra neteisingas, galime apsvarstyti normalią populiaciją su standartinis nuokrypis 1 ir vidutinis 5. Mėginio, turinčio du duomenų taškus, kurių kiekvieno vertės yra 6, imties vidurkis yra 6. 95% gyventojų pasitikėjimo intervalas yra 4,6–7,4. Akivaizdu, kad tai nesutampa su 95 proc normalus skirstinys, taigi joje nebus 95% gyventojų.

3 klaida

Trečia klaida yra pasakyti, kad 95% pasikliautinasis intervalas reiškia, kad 95% visų įmanomų imties vidurkių patenka į intervalo intervalą. Persvarstykite paskutinio skyriaus pavyzdį. Bet kokio antrojo dydžio mėginio, kurio vertės buvo tik mažesnės nei 4,6, vidurkis būtų mažesnis nei 4,6. Taigi šios imties priemonės nepatektų į šį konkretų pasitikėjimo intervalą. Mėginiai, kurie atitinka šį aprašymą, sudaro daugiau kaip 5% visos sumos. Taigi klaidinga teigti, kad šis pasikliautinasis intervalas apima 95% visų imties vidurkių.

4 klaida

Ketvirta klaida vertinant pasitikėjimo intervalus yra manyti, kad jie yra vienintelis klaidų šaltinis. Nors klaidų riba yra susijusi su patikimumo intervalu, yra ir kitų vietų, kuriose klaidos gali pasislinkti į statistinę analizę. Keletas pavyzdžių iš tokių klaidų rūšių gali būti klaidingas eksperimento planavimas, šališkumas imant mėginius ar nesugebėjimas gauti duomenų iš tam tikros populiacijos grupės.

instagram story viewer