Odchylenie vs odchylenie standardowe
Odchylenie vs odchylenie standardowe
W statystykach opisowych i wnioskujących stosuje się kilka wskaźników do opisania zestawu danych odpowiadającego jego centralnej tendencji, dyspersji i skośności. W wnioskowaniu statystycznym są one powszechnie znane jako estymatory, ponieważ szacują wartości parametrów populacji.
Dyspersja jest miarą rozprzestrzeniania się danych wokół centrum zestawu danych. Odchylenie standardowe jest jedną z najczęściej stosowanych miar dyspersji. Odchylenia każdego punktu danych od średniej są uwzględniane przy obliczaniu odchylenia standardowego. Stąd można argumentować, że odchylenie standardowe wraz ze średnią zapewni prawie wystarczający obraz zbioru danych.
Rozważ następujący zestaw danych. Wagi 10 osób (w kilogramach) mierzone są jako 70, 62, 65, 72, 80, 70, 63, 72, 77 i 79. Następnie średnia waga dziesięciu osób (w kilogramach) wynosi 71 (w kilogramach) ).
Co to jest odchylenie?
W statystyce odchylenie oznacza wielkość, o którą pojedynczy punkt danych różni się od stałej wartości, takiej jak średnia. Ogólnie rzecz biorąc, niech k będzie wartością stałą, a x1,x2),…, Xn oznacza zestaw danych. Następnie odchylenie xjot od k jest zdefiniowane jako (xjot- k).
Na przykład w powyższym zbiorze danych odpowiednie odchylenia od średniej wynoszą (70 - 71) = -1, (62 - 71) = -9, (65 - 71) = -6, (72 - 71) = 1, (80 - 71) = 9, (70 - 71) = -1, (63 - 71) = -8, (72 - 71) = 1, (77 - 71) = 6 i (79 - 71) = 8.
Co to jest odchylenie standardowe?
Gdy można wziąć pod uwagę dane z całej populacji (na przykład w przypadku spisu powszechnego), możliwe jest obliczenie standardowego odchylenia populacji. Aby obliczyć odchylenie standardowe populacji, najpierw oblicza się odchylenia wartości danych od średniej populacji. Średnia kwadratowa (średnia kwadratowa) odchyleń nazywana jest odchyleniem standardowym populacji. W symbolach σ = √ ∑ (xja-µ)2) / n gdzie µ jest średnią populacji, a n to wielkość populacji.
Gdy dane z próbki (o wielkości n) są wykorzystywane do oszacowania parametrów populacji, obliczane jest odchylenie standardowe próbki. Najpierw obliczane są odchylenia wartości danych od średniej próbki. Ponieważ średnia próbki jest stosowana zamiast średniej populacji (która jest nieznana), przyjęcie średniej kwadratowej nie jest właściwe. Aby zrekompensować użycie średniej próbki, suma kwadratów odchyleń jest dzielona przez (n-1) zamiast n. Przykładowe odchylenie standardowe jest pierwiastkiem kwadratowym tego. W symbolach matematycznych S = √ ∑ (xja-ẍ)2) / (n-1), gdzie S jest odchyleniem standardowym próbki, ẍ jest średnią próbki, a xi są punktami danych.
W poprzednim zestawie danych suma kwadratów odchylenia wynosi (-1)2) + (-9)2) + (-6)2) + 12) + 92) + (-1)2) + (-8)2) + 12) + 62) + 82) = 366. Zatem odchylenie standardowe populacji wynosi √ (366/10) = 6,05 (w kilogramach). (Zakładając, że populacja, o której mowa, składa się z 10 osób, od których dane zostały pobrane).
Jaka jest różnica między odchyleniem a odchyleniem standardowym? • Odchylenie standardowe jest indeksem statystycznym i estymatorem, ale odchylenie nie jest. • Odchylenie standardowe jest miarą rozproszenia klastra danych od centrum, natomiast odchylenie odnosi się do wielkości, o jaką pojedynczy punkt danych różni się od stałej wartości. |