Odchylenie standardowe a średnia
W statystykach opisowych i wnioskujących stosuje się kilka wskaźników do opisania zestawu danych odpowiadającego jego centralnej tendencji, dyspersji i skośności. W wnioskowaniu statystycznym są one powszechnie znane jako estymatory, ponieważ szacują wartości parametrów populacji.
Tendencja centralna odnosi się do centrum rozkładu wartości i lokalizuje go. Średnia, tryb i mediana są najczęściej stosowanymi wskaźnikami opisującymi centralną tendencję zbioru danych. Dyspersja to ilość rozprzestrzeniania się danych od centrum dystrybucji. Zakres i odchylenie standardowe są najczęściej stosowanymi miarami dyspersji. Współczynniki skośności Pearsona stosowane są przy opisywaniu skośności rozkładu danych. Tutaj skośność odnosi się do tego, czy zestaw danych jest symetryczny względem środka, czy nie, a jeśli nie, to jak jest przekrzywiony.
Co to znaczy?
Średnia jest najczęściej stosowanym wskaźnikiem tendencji centralnej. Przy danym zestawie danych średnią oblicza się, biorąc sumę wszystkich wartości danych, a następnie dzieląc ją przez liczbę danych. Na przykład, waga 10 osób (w kilogramach) mierzona jest jako 70, 62, 65, 72, 80, 70, 63, 72, 77 i 79. Wtedy średnia waga dziesięciu osób (w kilogramach) może być obliczone w następujący sposób. Suma wag wynosi 70 + 62 + 65 + 72 + 80 + 70 + 63 + 72 + 77 + 79 = 710. Średnia = (suma) / (liczba danych) = 710/10 = 71 (w kilogramach).
Podobnie jak w tym konkretnym przykładzie, średnia wartość zestawu danych może nie być punktem danych zestawu, ale będzie unikalna dla danego zestawu danych. Średnia będzie mieć takie same jednostki jak oryginalne dane. Dlatego można go oznaczyć na tej samej osi co dane i można go użyć do porównań. Ponadto nie ma ograniczeń znakowych dla średniej zestawu danych. Może być ujemny, zero lub dodatni, ponieważ suma zestawu danych może być ujemna, zero lub dodatnia.
Co to jest odchylenie standardowe?
Odchylenie standardowe jest najczęściej stosowanym wskaźnikiem dyspersji. Aby obliczyć odchylenie standardowe, najpierw oblicza się odchylenia wartości danych od średniej. Średnia kwadratowa odchyleń nazywa się odchyleniem standardowym.
W poprzednim przykładzie odpowiednie odchylenia od średniej wynoszą (70 - 71) = -1, (62-71) = -9, (65-71) = -6, (72-71) = 1, (80- 71) = 9, (70-71) = -1, (63-71) = -8, (72-71) = 1, (77-71) = 6 i (79-71) = 8. Suma kwadraty odchylenia to (-1) 2+ (-9)2)+ (-6)2)+ 12)+92)+ (-1)2)+ (-8)2)+ 12)+ 62) + 82) = 366. Odchylenie standardowe wynosi √ (366/10) = 6,05 (w kilogramach). Na podstawie powyższego można wywnioskować, że większość danych znajduje się w przedziale 71 ± 6,05, pod warunkiem, że zestaw danych nie jest mocno zniekształcony, i rzeczywiście tak jest w tym konkretnym przykładzie.
Ponieważ odchylenie standardowe ma te same jednostki, co dane pierwotne, daje nam miarę tego, o ile odchylenie danych pochodzi od centrum; większe odchylenie standardowe większe rozproszenie. Ponadto odchylenie standardowe będzie wartością nieujemną, niezależnie od charakteru danych w zestawie danych.
Jaka jest różnica między odchyleniem standardowym a średnią? • Odchylenie standardowe jest miarą dyspersji od centrum, podczas gdy średnia mierzy lokalizację centrum zbioru danych. • Odchylenie standardowe jest zawsze wartością nieujemną, ale średnia może przyjąć dowolną rzeczywistą wartość.
|