mediana Duomenų aibė yra vidurio taškas, kuriame tiksliai pusė duomenų verčių yra mažesnės arba lygios mediana. Panašiu būdu galime galvoti apie a tęstinistikimybės pasiskirstymas, užuot radę duomenų rinkinyje esančią vidurinę vertę, paskirstymo vidurį rasime kitaip.
Bendras tikimybės tankio funkcijos plotas yra 1, o tai sudaro 100%, ir todėl pusė to gali būti išreikšta puse arba 50 procentų. Viena didžiausių matematinės statistikos idėjų yra ta, kad tikimybę parodo sritis, esanti po kreivės tankio funkcija, kuri apskaičiuojama integralu, taigi ištisinio pasiskirstymo mediana yra taškas tikras numeris linija, kurioje tiksliai pusė ploto yra kairėje.
Tai trumpiau gali pasakyti šis netinkamas integralas. Ištisinio atsitiktinio kintamojo mediana X su tankio funkcija f( x) yra vertė M tokia, kad:
0.5=∫m−∞f(x)dx
Eksponentinio pasiskirstymo mediana
Dabar apskaičiuojame eksponentinio pasiskirstymo Exp (A) medianą. Atsitiktinis kintamasis su šiuo pasiskirstymu turi tankio funkciją
f(x) = e-x/ A/ A už x bet koks neigiamas tikrasis skaičius. Funkcijoje taip pat yra matematinė konstanta e, maždaug lygus 2,71828.Kadangi bet kurios neigiamos vertės tikimybės tankio funkcija yra lygi nuliui x, viskas, ką turime padaryti, tai integruoti šiuos dalykus ir išspręsti M:
0,5 = ∫0M f (x) dx
Kadangi integralas ∫ e-x/ A/Reklamax = -e-x/ A, rezultatas yra toks
0,5 = -e-M / A + 1
Tai reiškia, kad 0,5 = e-M / A ir, paėmę natūralų abiejų lygties pusių logaritmą, turime:
ln (1/2) = -M / A
Nuo 1/2 = 2-1, pagal logaritmų savybes rašome:
- ln2 = -M / A
Padauginus abi puses iš A, gauname rezultatą, kurio mediana M = A ln2.
Vidutinis statistikos netolygumas
Reikėtų paminėti vieną šio rezultato pasekmę: eksponentinio pasiskirstymo Exp (A) vidurkis yra A, o kadangi ln2 yra mažesnis nei 1, darytina išvada, kad sandauga Aln2 yra mažesnė už A. Tai reiškia, kad eksponentinio pasiskirstymo mediana yra mažesnė už vidurkį.
Tai prasminga, jei pagalvokime apie tikimybės tankio funkcijos grafiką. Dėl ilgos uodegos šis pasiskirstymas pasviręs į dešinę. Daugybę kartų, kai pasiskirstymas yra nukreiptas į dešinę, vidurkis yra dešinėje, viduryje.
Ką tai reiškia statistinės analizės prasme, mes dažnai galime numatyti, kad vidurkis ir mediana tiesiogiai nesutampa koreliuoti atsižvelgiant į duomenų pasvirimo į dešinę tikimybę, kuri gali būti išreikšta kaip nelygybės mediana žinomas kaip Čebiševo nelygybė.
Kaip pavyzdį apsvarstykite duomenų rinkinį, kuriame teigiama, kad asmuo iš viso priima 30 lankytojų per 10 valandų, kai vidutinis lankytojo laukimo laikas yra 20 minučių, duomenų rinkinyje gali būti teigiama, kad vidutinis laukimo laikas būtų 20–30 minučių, jei daugiau nei pusė lankytojų ateitų per pirmuosius penkis valandos.