Čebyšovo tikimybių nelygybė

Čebiševo nelygybė sako, kad bent 1-1 /K2 imties duomenų turi atitikti K standartiniai nuokrypiai nuo vidurkio (čia K yra koks nors teigiamas tikras numeris didesnis nei vienas).

Bet koks duomenų rinkinys, kuris paprastai yra paskirstomas arba yra a formos varpo kreivė, turi keletą funkcijų. Vienas iš jų susijęs su duomenų plitimu, palyginti su standartinių nuokrypių nuo vidurkio skaičiumi. Normaliame pasiskirstyme mes žinome, kad 68% duomenų yra vienas standartinis nuokrypis nuo vidurkio, 95% yra du standartiniai nuokrypiai nuo vidurkio, o maždaug 99% yra trijų standartinių nuokrypių nuo vidurkio.

Bet jei duomenų rinkinys nėra paskirstytas varpo kreivės pavidalu, skirtinga suma gali būti per vieną standartinį nuokrypį. „Chebyshev“ nelygybė suteikia galimybę sužinoti, kokia dalis duomenų patenka K standartiniai nuokrypiai nuo bet kokia duomenų rinkinys.

Faktai apie nelygybę

Aukščiau pateiktą nelygybę taip pat galime pasakyti, pakeisdami frazę „imties duomenys“ į tikimybės pasiskirstymas. Taip yra todėl, kad Čebiševo nelygybė atsiranda dėl tikimybės, kurią vėliau galima pritaikyti statistikoje.

instagram viewer

Svarbu pažymėti, kad ši nelygybė yra matematiškai įrodytas rezultatas. Tai nėra taip empirinis santykis tarp vidurkio ir režimo, arba nykščio taisyklė kuris jungia diapazoną ir standartinį nuokrypį.

Nelygybės iliustracija

Norėdami parodyti nelygybę, pažvelgsime į ją keliomis vertybėmis K:

  • Dėl K = 2 turime 1 - 1 /K2 = 1 - 1/4 = 3/4 = 75%. Taigi Chebyshevo nelygybė sako, kad mažiausiai 75% bet kokio paskirstymo duomenų verčių turi būti dviejų standartinių vidurkio nuokrypių.
  • Dėl K = 3 turime 1 - 1 /K2 = 1 - 1/9 = 8/9 = 89%. Taigi Chebyshevo nelygybė sako, kad mažiausiai 89% bet kokio paskirstymo duomenų verčių turi būti trys standartiniai vidurkio nuokrypiai.
  • Dėl K = 4 turime 1 - 1 /K2 = 1 - 1/16 = 15/16 = 93.75%. Taigi Chebyshevo nelygybė sako, kad mažiausiai 93,75% bet kokio paskirstymo duomenų verčių turi būti dviejų standartinių vidurkio nuokrypių.

Pavyzdys

Tarkime, kad atrinkome šunų svorį vietinėje gyvūnų prieglaudoje ir nustatėme, kad mūsų mėginio vidurkis yra 20 svarų, o standartinis nuokrypis yra 3 svarai. Naudodamiesi Chebyshev nelygybe, mes žinome, kad mažiausiai 75% šunų, iš kurių atrinkome mėginius, svoris yra du standartiniai nuokrypiai nuo vidurkio. Dvigubas standartinis nuokrypis suteikia mums 2 x 3 = 6. Atimkite ir pridėkite tai iš 20 vidurkio. Tai mums sako, kad 75% šunų svoris nuo 14 iki 26 svarų.

Nelygybės naudojimas

Jei žinome daugiau apie paskirstymą, su kuriuo dirbame, tada paprastai galime garantuoti, kad daugiau duomenų yra tam tikras skaičius standartinių nuokrypių nuo vidurkio. Pavyzdžiui, jei mes žinome, kad pasiskirstymas yra normalus, tada 95% duomenų yra du standartiniai nuokrypiai nuo vidurkio. Čebiševo nelygybė sako, kad šioje situacijoje mes tai žinome bent jau 75% duomenų yra du standartiniai nuokrypiai nuo vidurkio. Kaip matome šiuo atveju, tai gali būti daug daugiau nei šie 75 proc.

Nelygybė vertinga tuo, kad jis sukuria „blogesnio atvejo“ scenarijų, kuriame vieninteliai dalykai, kuriuos žinome apie imties duomenis (arba tikimybių pasiskirstymą), yra vidurkis ir standartinis nuokrypis. Kai apie savo duomenis dar nieko nežinome, „Chebyshev“ nelygybė suteikia tam tikros papildomos informacijos apie tai, kaip pasiskirsto duomenų rinkinys.

Nelygybės istorija

Nelygybė pavadinta Rusijos matematiko Pafnuty Chebyshev vardu, kuris 1874 m. Pirmą kartą pareiškė apie nelygybę be įrodymų. Po dešimties metų nelygybę įrodė Markovas savo daktaro laipsnyje. disertacija. Dėl skirtingų variantų, kaip atvaizduoti rusų abėcėlę angliškai, Čebiševas taip pat vadinamas „Tchebysheff“.