Różnica między wariancją próbki a wariancją populacji

Wyjaśnienie

W statystyce pojęcie próbkowanie odnosi się do wyboru części zagregowanych danych statystycznych w celu uzyskania odpowiednich informacji o całości. Zbiorcze lub całkowite informacje statystyczne dotyczące określonego charakteru wszystkich członków objętych dochodzeniem nazywane są „populacją” lub „wszechświatem”. (Das, N.G., 2010). Wybrana część populacji, która jest wykorzystywana do uzyskania cech populacji lub wszechświata jest określana jako „próbka”. Przyjmuje się, że populacja składa się z pojedynczych jednostek lub członków, a niektóre jednostki są objęte próbą. Łączna liczba jednostek populacji nazywa się wielkością populacji, a liczba próbek nazywa się wielkością próby. Populacja i próbka mogą być skończone lub nieskończone i podobnie mogą istnieć lub być hipotetyczne.

Zmienność: Wariancja jest wartością liczbową, która pokazuje, jak szeroko poszczególne liczby w zbiorze danych rozkładają się względem średniej. Tak daleko każda liczba jest od średniej, a więc od siebie nawzajem. Wariancja wartości zerowej oznacza, że ​​wszystkie dane są identyczne. Im więcej wariancji, tym więcej wartości rozkłada się względem średniej, a więc od siebie nawzajem. Im mniejsza wariancja, tym mniejsze są wartości rozłożone względem średniej, a więc od siebie nawzajem, a wariancja nie może być ujemna.

Różnica między wariancją populacji a wariancją próby

Główna różnica między wariancją populacji a wariancją próby dotyczy obliczenia wariancji. Odchylenie oblicza się w pięciu krokach. Obliczana jest pierwsza średnia, następnie obliczamy odchylenia od średniej, a po trzecie odchylenia są kwadratowe, po czwarte kwadratowe odchylenia są sumowane, a na koniec ta suma jest dzielona przez liczbę elementów, dla których obliczana jest wariancja. Zatem wariancja = Σ (xi-x -) / n. Gdzie xi = ith. Liczba, x- = średnia i n = liczba pozycji…

Teraz, gdy wariancja ma być obliczona na podstawie danych o populacji, n jest równe liczbie elementów. Zatem jeśli wariancję ciśnienia krwi wszystkich 1000 osób należy obliczyć na podstawie danych o ciśnieniu krwi wszystkich 1000 osób, to n = 1000. Jednak gdy wariancja jest obliczona na podstawie danych próbki 1 należy odjąć od n przed podzieleniem suma kwadratowych odchyleń. Zatem w powyższym przykładzie, jeśli przykładowe dane zawierają 100 pozycji, mianownik miałby wartość 100-1 = 99.

Z tego powodu wartość wariancji obliczona na podstawie danych próbki jest wyższa niż wartość, którą można było ustalić na podstawie danych populacji. Logiką tego jest zrekompensowanie naszego braku informacji o danych dotyczących populacji. Niemożliwe jest ustalenie wariancji wysokości u ludzi, ponieważ nasz absolutny brak informacji o wysokościach wszystkich żywych istot ludzkich, nie mówiąc już o przyszłości. Nawet jeśli weźmiemy jeden umiarkowany przykład, taki jak dane dotyczące populacji dotyczące wysokości wszystkich żyjących mężczyzn w USA, jest to fizycznie możliwe, ale związane z tym koszty i czas byłyby sprzeczne z celem ich obliczenia. Z tego powodu przykładowe dane są pobierane dla większości celów statystycznych, czemu towarzyszy brak informacji o większości danych. Aby to zrekompensować, wartość wariancji i odchylenie standardowe, które są pierwiastkiem kwadratowym wariancji, są wyższe w przypadku danych próbki niż wariancji z danych populacji.

Działa to jak automatyczna tarcza dla analityków i decydentów. Logika dotyczy decyzji w sprawie budżetowania kapitału, finansów osobistych i biznesowych, budownictwa, zarządzania ruchem i wielu stosownych dziedzin. Pomaga to interesariuszowi zachować bezpieczeństwo podczas podejmowania decyzji lub wyciągania innych wniosków.

Streszczenie: Wariancja populacji odnosi się do wartości wariancji obliczonej na podstawie danych populacji, a wariancja próby to wariancja obliczona na podstawie danych próbki. Ze względu na tę wartość mianownika we wzorze na wariancję w przypadku danych z próby wynosi „n-1”, a dla danych populacji „n”. W rezultacie zarówno wariancja, jak i odchylenie standardowe uzyskane z danych z próby są większe niż te ustalone z danych dotyczących populacji.