Populacja a odchylenie standardowe próbki
W statystyce używa się kilku wskaźników do opisania zestawu danych odpowiadającego jego centralnej tendencji, dyspersji i skośności. Odchylenie standardowe jest jedną z najczęstszych miar rozproszenia danych od centrum zestawu danych.
Ze względu na trudności praktyczne nie będzie możliwe wykorzystanie danych z całej populacji podczas testowania hipotezy. Dlatego wykorzystujemy wartości danych z próbek, aby wnioskować o populacji. W takiej sytuacji są one nazywane estymatorami, ponieważ szacują wartości parametrów populacji.
Niezwykle ważne jest stosowanie wnioskowania bezstronnych estymatorów. O estymatorze mówi się, że jest bezstronny, jeśli oczekiwana wartość tego estymatora jest równa parametrowi populacji. Na przykład używamy średniej próby jako obiektywnego estymatora średniej populacji. (Matematycznie można wykazać, że oczekiwana wartość średniej próby jest równa średniej populacji). W przypadku szacowania odchylenia standardowego populacji odchylenie standardowe próby jest również obiektywnym estymatorem.
Co to jest odchylenie standardowe populacji?
Gdy można uwzględnić dane z całej populacji (na przykład w przypadku spisu), można obliczyć odchylenie standardowe populacji. Aby obliczyć odchylenie standardowe populacji, najpierw oblicza się odchylenia wartości danych od średniej populacji. Średnia kwadratowa (średnia kwadratowa) odchyleń nazywana jest odchyleniem standardowym populacji.
W klasie 10 uczniów można łatwo zebrać dane o uczniach. Jeśli hipoteza zostanie przetestowana na tej populacji studentów, nie ma potrzeby używania wartości próbki. Na przykład, masy 10 uczniów (w kilogramach) mierzone są na 70, 62, 65, 72, 80, 70, 63, 72, 77 i 79. Następnie średnia waga dziesięciu osób (w kilogramach) wynosi (70 + 62 + 65 + 72 + 80 + 70 + 63 + 72 + 77 + 79) / 10, czyli 71 (w kilogramach). To średnia populacji.
Teraz, aby obliczyć odchylenie standardowe populacji, obliczamy odchylenia od średniej. Odpowiednie odchylenia od średniej wynoszą (70 - 71) = -1, (62 - 71) = -9, (65 - 71) = -6, (72 - 71) = 1, (80 - 71) = 9, (70 - 71) = -1, (63 - 71) = -8, (72 - 71) = 1, (77 - 71) = 6 i (79 - 71) = 8. Suma kwadratów odchylenia wynosi ( -1)2) + (-9)2) + (-6)2) + 12) + 92) + (-1)2) + (-8)2) + 12) + 62) + 82) = 366. Odchylenie standardowe populacji wynosi √ (366/10) = 6,05 (w kilogramach). 71 to dokładna średnia waga uczniów klasy, a 6,05 to dokładne odchylenie standardowe od 71.
Co to jest odchylenie standardowe próbki?
Gdy dane z próbki (o wielkości n) są wykorzystywane do oszacowania parametrów populacji, obliczane jest odchylenie standardowe próbki. Najpierw obliczane są odchylenia wartości danych od średniej próbki. Ponieważ średnia próbki jest stosowana zamiast średniej populacji (która jest nieznana), przyjęcie średniej kwadratowej nie jest właściwe. Aby zrekompensować użycie średniej próbki, suma kwadratów odchyleń jest dzielona przez (n-1) zamiast n. Przykładowe odchylenie standardowe jest pierwiastkiem kwadratowym tego. W symbolach matematycznych S = √ ∑ (xja-ẍ)2) / (n-1), gdzie S oznacza odchylenie standardowe próbki, ẍ oznacza średnią próbki xjato punkty danych.
Załóżmy teraz, że w poprzednim przykładzie populacja to uczniowie całej szkoły. Wtedy klasa będzie tylko próbką. Jeśli ta próbka zostanie użyta do oszacowania, odchylenie standardowe próbki wyniesie √ (366/9) = 6,38 (w kilogramach), ponieważ 366 podzielono przez 9 zamiast 10 (wielkość próby). Faktem jest, że nie jest to gwarantowana dokładna wartość odchylenia standardowego populacji. Jest to jedynie szacunek.
Jaka jest różnica między odchyleniem standardowym populacji a odchyleniem standardowym próbki? • Odchylenie standardowe populacji jest dokładną wartością parametru używaną do pomiaru dyspersji od środka, podczas gdy odchylenie standardowe próbki jest dla niego obiektywnym estymatorem. • Odchylenie standardowe populacji jest obliczane, gdy znane są wszystkie dane dotyczące każdej osoby w populacji. W przeciwnym razie obliczane jest odchylenie standardowe próbki. • Odchylenie standardowe populacji podano przez σ = √ ∑ (xi-µ)2)/ n gdzie µ jest średnią populacji, a n jest wielkością populacji, ale odchylenie standardowe próbki podano przez S = √ ∑ (xi-ẍ)2) / (n-1) gdzie ẍ jest średnią próbki, a n jest wielkością próby.
|