Tai vidurnakčio naujausio filmo rodymas. Žmonės yra išrikiuoti ne teatre, o laukia patekti. Tarkime, kad jūsų paprašys rasti linijos centrą. Kaip tu tai padarysi?
Yra keletas skirtingų būdų, kaip tai padaryti išsprendus šią problemą. Galų gale jūs turėtumėte išsiaiškinti, kiek žmonių buvo eilėje, ir tada paimkite pusę to skaičiaus. Jei bendras skaičius yra lygus, tada linijos centras būtų tarp dviejų žmonių. Jei bendras skaičius yra nelyginis, tada centre būtų vienas asmuo.
Galite paklausti: „Ką bendro turi linijos centro radimas statistika? “Ši idėja rasti centrą yra būtent ta, kuri naudojama apskaičiuojant duomenų rinkinio mediana.
Kas yra mediana?
Mediana yra vienas iš trijų pagrindinių būdų apskaičiuoti statistiniai duomenys. Skaičiuoti sunkiau nei režimą, tačiau ne taip daug darbo, kiek apskaičiuoti vidurkį. Tai yra centras panašiai kaip ir žmonių linijos centras. Išvardžius duomenų vertes didėjančia tvarka, mediana yra duomenų vertė, turinti tą patį skaičių duomenų verčių virš jos ir žemiau.
Pirmasis atvejis: nelyginis verčių skaičius
Tikrinama vienuolika akumuliatorių, kad pamatytumėte, kiek laiko jie trunka. Jų gyvenimo laikas valandomis nurodomas 10, 99, 100, 103, 103, 105, 110, 111, 115, 130, 131. Kokia yra vidutinė gyvenimo trukmė? Kadangi duomenų skaičius yra nelyginis, tai atitinka eilutę, kurioje yra nelyginis žmonių skaičius. Centras bus vidurinė vertė.
Yra vienuolika duomenų verčių, taigi šeštoji yra centre. Todėl vidutinė baterijos veikimo trukmė yra šeštoji šio sąrašo vertė arba 105 valandos. Atminkite, kad mediana yra viena iš duomenų verčių.
Antras atvejis: lyginis skaičius verčių
Sveriama dvidešimt kačių. Jų svoris svarais pateiktas iš 4, 5, 5, 5, 6, 6, 6, 7, 7, 7, 8, 8, 9, 10, 10, 10, 11, 12, 12, 13. Koks yra vidutinis kačių svoris? Kadangi duomenų lygių skaičius yra lyginis, tai atitinka eilutę su lygiu žmonių skaičiumi. Centras yra tarp dviejų vidurinių verčių.
Šiuo atveju centras yra tarp dešimtos ir vienuoliktos duomenų vertės. Norėdami rasti mediana, mes apskaičiuojame šių dviejų verčių vidurkį ir gauname (7 + 8) / 2 = 7,5. Čia mediana nėra viena iš duomenų verčių.
Bet kokie kiti atvejai?
Vienintelės dvi galimybės yra turėti lyginį ar nelyginį skaičių duomenų verčių. Taigi aukščiau pateikti du pavyzdžiai yra vieninteliai įmanomi būdai, kaip apskaičiuoti mediana. Arba mediana bus vidurinė vertė, arba mediana bus vidurkis iš dviejų vidurinės vertybės. Paprastai duomenų rinkiniai yra daug didesni nei tie, kuriuos apžvelgėme aukščiau, tačiau mediana nustatoma taip, kaip šie du pavyzdžiai.
Šalutinių reiškinių poveikis
Vidurkis ir būdas yra labai jautrūs nuokrypiams. Tai reiškia, kad pašalinės vietos buvimas dramatiškai paveiks abi šias centro priemones. Vienas iš medianos pranašumų yra tas, kad jai nedaro įtakos tiek pašalinis dalykas.
Norėdami tai pamatyti, atsižvelkite į 3, 4, 5, 5, 6 duomenų rinkinį. Vidurkis yra (3 + 4 + 5 + 5 + 6) / 5 = 4,6, o mediana yra 5. Dabar saugokite tą patį duomenų rinkinį, bet pridėkite reikšmę 100: 3, 4, 5, 5, 6, 100. Aišku 100 yra pašalinė reikšmė, nes ji yra daug didesnė už visas kitas vertybes. Naujojo rinkinio vidurkis dabar yra (3 + 4 + 5 + 5 + 6 + 100) / 6 = 20,5. Tačiau naujojo rinkinio mediana yra 5. nors
Mediano taikymas
Dėl to, ką mes matėme aukščiau, mediana yra tinkamiausias vidurkio matas, kai duomenyse yra pašalinių reikšmių. Kai pranešama apie pajamas, tipiškas būdas yra pateikti vidutines pajamas. Tai daroma todėl, kad nedaug žmonių, gaunančių labai dideles pajamas, iškreipia vidutines pajamas (pagalvok Bill Gates ir Opra).