Tarkime, kad mes turime Atsitiktinis pavyzdys iš dominančios populiacijos. Mes galime turėti teorinį modelį, kaip gyventojų yra paskirstomas. Tačiau gali būti keletas gyventojų parametrus iš kurių mes nežinome vertybių. Didžiausias tikimybės įvertinimas yra vienas iš būdų nustatyti šiuos nežinomus parametrus.
Pagrindinė maksimalios tikimybės įvertinimo idėja yra ta, kad mes nustatome šių nežinomų parametrų reikšmes. Mes tai darome tokiu būdu, kad maksimaliai padidintume susijusią sąnario tikimybės tankio funkciją arba tikimybės masės funkcija. Tai pamatysime išsamiau toliau. Tada mes apskaičiuosime keletą maksimalaus tikimybės įvertinimo pavyzdžių.
Maksimalios tikimybės įvertinimo žingsniai
Pirmiau pateiktą diskusiją galima apibendrinti atlikus šiuos veiksmus:
- Pradėkite nuo nepriklausomų atsitiktinių kintamųjų X imties1, X2,... Xn iš bendro paskirstymo, kurio tikimybės tankio funkcija yra f (x; θ1,.. .θk). Temos yra nežinomi parametrai.
- Kadangi mūsų imtis yra nepriklausoma, tikimybė gauti konkrečią imtį, kurią stebime, nustatoma padauginus iš mūsų tikimybes. Tai suteikia tikimybės funkciją L (θ 1,.. .θk) = f (x1 ;θ1,.. .θk) f (x2 ;θ1,.. .θk)... f (xn ;θ1,.. .θk) = Π f (xi ;θ1,.. .θk).
- Kitas, mes naudojame Kalkulis rasti teta vertes, kurios maksimaliai padidina mūsų tikimybės funkciją L.
- Tiksliau, diferencijuojame tikimybės funkciją L with atžvilgiu, jei yra vienas parametras. Jei yra keli parametrai, mes apskaičiuojame dalinius L išvestinius kiekvienos teta parametrų atžvilgiu.
- Norėdami tęsti maksimalizacijos procesą, nustatykite L (arba dalinių darinių) išvestinę lygią nuliui ir išspręskite teta.
- Tada galime naudoti kitus metodus (pvz., Antrą išvestinių testą), kad patikrintume, ar radome maksimumą savo tikimybių funkcijai.
Pavyzdys
Tarkime, kad mes turime sėklų paketą, kurio kiekviena turi pastovią tikimybę p sėkmės daigumas. Mes sodiname n iš jų ir suskaičiuokite, kiek daigų yra. Tarkime, kad kiekviena sėkla dygsta nepriklausomai nuo kitų. Kaip nustatome parametro didžiausią tikimybę p?
Pirmiausia pastebime, kad kiekviena sėkla yra modeliuojama pagal Bernoulli pasiskirstymą su sėkme p. Mes leidome X turi būti 0 arba 1, o vienos sėklos tikimybės masės funkcija yra f(x; p ) = px(1 - p)1 - x.
Mūsų imtį sudaro n skirtingi Xi, kiekvienas iš jų turi Bernoulli paskirstymą. Dygstančios sėklos turi Xi = 1 ir sėklos, kurios neišdygsta, turi Xi = 0.
Tikimybių funkciją suteikia:
L ( p ) = Π pxi(1 - p)1 - xi
Matome, kad tikimybės funkciją perrašyti galima naudojant eksponentų dėsnius.
L ( p ) = pΣ xi(1 - p)n - Σ xi
Toliau mes išskaidysime šią funkciją p. Manome, kad visų Xi yra žinomi, taigi yra pastovūs. Norėdami atskirti tikimybių funkciją, turime naudoti produkto taisyklė kartu su galios taisykle:
L '( p ) = Σ xip-1 + Σ xi (1 - p)n - Σ xi- (n - Σ xi ) pΣ xi(1 - p)n-1 - Σ xi
Perrašome kai kuriuos neigiamus eksponentus ir turime:
L '( p ) = (1/p) Σ xipΣ xi (1 - p)n - Σ xi- 1/(1 - p) (n - Σ xi ) pΣ xi(1 - p)n - Σ xi
= [(1/p) Σ xi - 1/(1 - p) (n - Σ xi)]ipΣ xi (1 - p)n - Σ xi
Dabar, norėdami tęsti maksimizavimo procesą, mes nustatėme, kad šis darinys lygus nuliui, ir išspręskime p:
0 = [(1/p) Σ xi - 1/(1 - p) (n - Σ xi)]ipΣ xi (1 - p)n - Σ xi
Nuo p ir (1- p) yra nulis, mes turime tai
0 = (1/p) Σ xi - 1/(1 - p) (n - Σ xi).
Padauginus abi lygties puses iš p(1- p) suteikia mums:
0 = (1 - p) Σ xi - p (n - Σ xi).
Išplečiame dešinę pusę ir matome:
0 = Σ xi - p Σ xi - pn + pΣ xi = Σ xi - pn.
Taigi Σ xi = pn ir (1 / n) Σ xi = p. Tai reiškia, kad maksimali tikimybė įvertinti p yra imties vidurkis. Konkrečiau tai yra daigintų sėklų mėginių dalis. Tai puikiai atitinka tai, ką mums pasakytų intuicija. Norėdami nustatyti sėklų, kurios sudygs, dalį, pirmiausia apsvarstykite mėginį iš dominančios populiacijos.
Žingsnių modifikacijos
Aukščiau pateiktame žingsnių sąraše yra keletas pakeitimų. Pavyzdžiui, kaip mes matėme aukščiau, paprastai verta skirti šiek tiek laiko naudojant tam tikrą algebrą, kad būtų supaprastinta tikimybės funkcijos išraiška. Taip yra todėl, kad diferenciaciją būtų lengviau atlikti.
Kitas aukščiau pateikto žingsnių sąrašo pakeitimas - atsižvelgti į natūralius logaritmus. Funkcijos L maksimumas įvyks tame pačiame taške, kaip ir natūraliojo L logaritmo atveju. Taigi Ln L padidinimas yra lygus L funkcijos maksimalizavimui.
Dėl L eksponentinių funkcijų buvimo daugybę kartų natūraliojo L logaritmo paėmimas labai supaprastins kai kuriuos mūsų darbus.
Pavyzdys
Matome, kaip naudoti natūralų logaritmą, peržiūrėdami pavyzdį iš viršaus. Mes pradedame nuo tikimybių funkcijos:
L ( p ) = pΣ xi(1 - p)n - Σ xi .
Tada mes naudojame savo logaritmo įstatymus ir matome, kad:
R ( p ) = ln L ( p ) = Σ xi ln p + (n - Σ xi) ln (1 - p).
Jau matome, kad išvestinę yra daug lengviau apskaičiuoti:
R '( p ) = (1/p) Σ xi - 1/(1 - p)(n - Σ xi) .
Dabar, kaip ir anksčiau, mes nustatėme šį darinį lygų nuliui ir padauginkime abi puses iš p (1 - p):
0 = (1- p ) Σ xi - p(n - Σ xi) .
Mes sprendžiame už p ir raskite tą patį rezultatą, kaip ir anksčiau.
Natūraliojo L (p) logaritmo naudojimas yra naudingas kitu būdu. Daug lengviau apskaičiuoti antrąjį R (p) darinį, norint patikrinti, ar tikrai taške (1 / n) Σ xi = p.
Pavyzdys
Tarkime, kad turime kitą pavyzdį X atsitiktinai1, X2,... Xn iš populiacijos, kurią mes modeliuojame pagal eksponentinį pasiskirstymą. Vieno atsitiktinio kintamojo tikimybės tankio funkcija yra tokios formos f( x ) = θ-1e -x/θ
Tikimybės funkciją suteikia jungtinės tikimybės tankio funkcija. Tai yra kelių iš šių tankio funkcijų produktas:
L (θ) = Π θ-1e -xi/θ = θ-ne -Σxi/θ
Dar kartą pravartu atsižvelgti į natūralų tikimybių funkcijos logaritmą. Norint tai atskirti, reikės mažiau darbo nei diferencijuoti tikimybių funkciją:
R (θ) = ln L (θ) = ln [θ-ne -Σxi/θ]
Mes naudojame savo logaritmų dėsnius ir gauname:
R (θ) = ln L (θ) = - n ln θ + -Σxi/θ
Mes skiriamės θ atžvilgiu ir turime:
R '(θ) = - n / θ + Σxi/θ2
Nustatykite šį darinį lygiu nuliui ir pamatysime, kad:
0 = - n / θ + Σxi/θ2.
Padauginkite abi puses iš θ2 ir rezultatas yra toks:
0 = - n θ + Σxi.
Dabar naudokite algebrą, kad išspręstumėte θ:
θ = (1 / n) Σxi.
Iš to matome, kad imties vidurkis yra tai, kas padidina tikimybės funkciją. Parametras θ, kuris tinka mūsų modeliui, turėtų būti visų mūsų pastebėjimų vidurkis.
Ryšiai
Yra ir kitų rūšių vertintojai. Vienas alternatyvus įvertinimo tipas vadinamas nešališkas vertintojas. Šiam tipui turime apskaičiuoti numatomą mūsų statistikos vertę ir nustatyti, ar ji atitinka atitinkamą parametrą.