Kas yra pakreipimas statistikoje?

Kai kurie duomenų paskirstymai, tokie kaip varpo kreivė arba normalus skirstinys, yra simetriški. Tai reiškia, kad paskirstymas dešinėje ir kairėje yra puikūs veidrodiniai vienas kito vaizdai. Ne kiekvienas duomenų pasiskirstymas yra simetriškas. Duomenų, kurie nėra simetriški, rinkiniai yra asimetriniai. Asimetrinio pasiskirstymo matas yra vadinamas paslankumu.

Vidurkis, mediana ir būdas yra visi centro priemonės duomenų rinkinio. Duomenų pakrypimą galima nustatyti pagal tai, kaip šie kiekiai yra susiję vienas su kitu.

Pasukta į dešinę

Į dešinę nukreipti duomenys turi ilgą uodegą, kuri tęsiasi į dešinę. Alternatyvus būdas kalbėti apie duomenų rinkinį, nukreiptą į dešinę, yra pasakyti, kad jis yra teigiamai iškraipytas. Šioje situacijoje vidutinis ir mediana abu yra didesni už režimą. Paprastai didžioji laiko dalis, kai duomenys nukreipti į dešinę, vidurkis bus didesnis nei mediana. Apibendrinant, jei duomenų rinkinys nukreiptas į dešinę:

  • Visada: reiškia daugiau nei režimas
  • Visada: vidutinė didesnė už režimą
  • Didžiąją laiko dalį: vidutinis didesnis nei mediana
instagram viewer

Pasukta į kairę

Situacija pasikeičia, kai tvarkome duomenis, nukreiptus į kairę. Į kairę nukreipti duomenys turi ilgą uodegą, kuri tęsiasi į kairę. Kitas būdas kalbėti apie duomenų rinkinį, nukreiptą į kairę, yra pasakyti, kad jis yra neigiamai iškraipytas. Šioje situacijoje vidutinis ir mediana yra mažesni už režimą. Paprastai didžiąją laiko dalį duomenų, nukreiptų į kairę, vidurkis bus mažesnis nei mediana. Apibendrinant, jei duomenų rinkinys nukreiptas į kairę:

  • Visada: reiškia mažiau nei režimas
  • Visada: mažesnė už režimą
  • Didžiąją laiko dalį: reiškia mažiau nei mediana

Griežtumo matas

Vienas dalykas yra pažvelgti į du duomenų rinkinius ir nustatyti, kad vienas yra simetriškas, o kitas - asimetriškas. Kitas dalykas yra pažvelgti į du asimetrinių duomenų rinkinius ir pasakyti, kad vienas yra labiau pasviręs nei kitas. Gali būti labai subjektyvu nustatyti, kas yra labiau iškreiptas, paprasčiausiai pažiūrėjus į pasiskirstymo grafiką. Štai kodėl yra būdų, kaip skaitmeniniu būdu apskaičiuoti sruogos dydį.

Vienas pakreipimo matas, vadinamas Pearsono pirmuoju skeveldros koeficientu, yra atimti vidurkį iš režimo ir tada padalyti šį skirtumą iš standartinis nuokrypis duomenų. Skirtumas padalijamas todėl, kad turime be matmens kiekį. Tai paaiškina, kodėl duomenys, nukreipti į dešinę, yra teigiami. Jei duomenų rinkinys pasviręs į dešinę, vidurkis yra didesnis nei režimas, todėl atėmus režimą iš vidurkio gaunamas teigiamas skaičius. Panašus argumentas paaiškina, kodėl duomenys, nukreipti į kairę, yra neigiami.

Antrasis Pearsono kreivumo koeficientas taip pat naudojamas norint įvertinti duomenų rinkinio asimetriją. Iš šio kiekio mes atimame režimą iš medianos, padauginame jį iš trijų ir tada padalijame iš standartinio nuokrypio.

Nepriekaištingų duomenų taikymas

Suklaidinti duomenys atsiranda gana natūraliai įvairiose situacijose. Pajamos yra nukreiptos į dešinę, nes net keli žmonės, uždirbantys milijonus dolerių, gali smarkiai paveikti vidurkį, o neigiamos pajamos nėra. Panašiai duomenys, susiję su produkto, pavyzdžiui, lemputės ženklo, eksploatavimo trukme, yra nukreipti į dešinę. Mažiausias, koks gali būti viso gyvenimo laikotarpis, yra lygus nuliui, o ilgalaikės lemputės duos teigiamą duomenų nusiteikimą.