A apskaičiavimas pavyzdys dispersija arba standartinis nuokrypis paprastai nurodoma kaip trupmena. Šios trupmenos skaitiklis apima kvadratinių nuokrypių nuo vidurkio sumą. Statistikoje, šios visos kvadratų sumos formulė yra:
Σ (xi - x̄)2
Čia simbolis x̄ reiškia pavyzdinį vidurkį, o simbolis Σ nurodo sudėti kvadratinius skirtumus (xi - x̄) visiems i.
Nors ši formulė veikia skaičiavimams, yra lygiavertė trumpa formulė, kuriai nereikia visų pirma apskaičiuoti imties vidurkis. Ši trumpinių formulė kvadratų sumai yra
Σ (xi2) - (Σ xi)2/n
Čia kintamasis n nurodo duomenų imties taškų skaičių.
Standartinės formulės pavyzdys
Norėdami pamatyti, kaip veikia ši nuorodų formulė, nagrinėsime pavyzdį, kuris apskaičiuojamas naudojant abi formules. Tarkime, kad mūsų pavyzdys yra 2, 4, 6, 8. Imties vidurkis yra (2 + 4 + 6 + 8) / 4 = 20/4 = 5. Dabar mes apskaičiuojame kiekvieno duomenų taško skirtumą su vidurkiu 5.
- 2 – 5 = -3
- 4 – 5 = -1
- 6 – 5 = 1
- 8 – 5 = 3
Dabar mes padalijame kiekvieną iš šių skaičių ir sudedam juos. (-3)2 + (-1)2 + 12 + 32 = 9 + 1 + 1 + 9 = 20.
Skubios formulės pavyzdys
Dabar kvadratų sumai nustatyti naudosime tą patį duomenų rinkinį: 2, 4, 6, 8, naudodami nuorodų formulę. Pirmiausia išaukštiname kiekvieną duomenų tašką ir sudedame juos: 22 + 42 + 62 + 82 = 4 + 16 + 36 + 64 = 120.
Kitas žingsnis - sudėti visus duomenis ir išmatuoti šią sumą: (2 + 4 + 6 + 8)2 = 400. Mes padalijame tai iš duomenų taškų skaičiaus, kad gautume 400/4 = 100.
Dabar mes atimame šį skaičių iš 120. Tai reiškia, kad kvadratinių nuokrypių suma yra 20. Tai buvo būtent skaičius, kurį mes jau radome iš kitos formulės.
Kaip tai veikia?
Daugelis žmonių tiesiog priims formulę pagal nominalią vertę ir net neįsivaizduoja, kodėl ši formulė veikia. Naudodami šiek tiek algebros, galime išsiaiškinti, kodėl ši nuorodų formulė yra lygi standartiniam, tradiciniam kvadratinių nuokrypių sumos apskaičiavimo būdui.
Nors realiojo pasaulio duomenų rinkinyje gali būti šimtai, jei ne tūkstančiai verčių, mes manysime, kad yra tik trys duomenų vertės: x1, x2, x3. Tai, ką mes matome čia, būtų galima išplėsti iki duomenų rinkinio, turinčio tūkstančius taškų.
Pirmiausia pastebime, kad (x1 + x2 + x3) = 3 x̄. Išraiška Σ (xi - x̄)2 = (x1 - x̄)2 + (x2 - x̄)2 + (x3 - x̄)2.
Dabar mes naudojame pagrindinės algebros faktą, kad (a + b)2 = a2 + 2ab + b2. Tai reiškia, kad (x1 - x̄)2 = x12 -2x1 x̄ + x̄2. Mes tai darome dėl kitų dviejų mūsų apibendrinimo terminų ir turime:
x12 -2x1 x̄ + x̄2 + x22 -2x2 x̄ + x̄2 + x32 -2x3 x̄ + x̄2.
Mes pertvarkome tai ir turime:
x12+ x22 + x32+ 3x̄2 - 2x̄ (x1 + x2 + x3) .
Perrašydami (x1 + x2 + x3) = 3x̄ aukščiau pateiktas tampa:
x12+ x22 + x32 - 3x̄2.
Dabar nuo 3x̄2 = (x1+ x2 + x3)2/ 3, mūsų formulė tampa:
x12+ x22 + x32 - (x1+ x2 + x3)2/3
Tai yra ypatingas bendros formulės, minėtos anksčiau, atvejis:
Σ (xi2) - (Σ xi)2/n
Ar tai tikrai nuoroda?
Gali neatrodyti, kad ši formulė yra tikrai nuoroda. Pagaliau aukščiau pateiktame pavyzdyje atrodo, kad yra tiek pat skaičiavimų. Iš dalies tai susiję su tuo, kad mes pažiūrėjome tik į nedidelį imties dydį.
Padidinę savo imties dydį matome, kad nuorodos formulė sumažina skaičiavimų skaičių maždaug perpus. Mums nereikia atimti vidurkio iš kiekvieno duomenų taško ir tada kvadratinį rezultatą. Tai labai sumažina bendrą operacijų skaičių.