Tendencja centralna implikuje tendencję punktów danych do skupiania się wokół swojej centralnej lub środkowej wartości. Dwie najczęściej stosowane miary tendencji centralnej to średnia i mediana. Oznaczać jest zdefiniowany jako „centralna” wartość danego zestawu danych, natomiast mediana jest wartością „najbardziej środkową” w danym zestawie danych.
Idealną miarą tendencji centralnej jest ta, która jest jasno określona, łatwa do zrozumienia, po prostu obliczalna. Powinien opierać się na wszystkich obserwacjach, a najmniej narażony na ekstremalne obserwacje obecne w zbiorze danych.
Ludzie często kontrastują te dwa mierniki, ale faktem jest, że są one różne. W tym artykule szczególnie podkreślono podstawowe różnice między średnią a medianą. Spójrz.
Podstawa do porównania | Oznaczać | Mediana |
---|---|---|
Znaczenie | Średnia odnosi się do prostej średniej danego zestawu wartości lub wielkości. | Mediana jest zdefiniowana jako środkowa liczba na uporządkowanej liście wartości. |
Co to jest? | Jest to średnia arytmetyczna. | Jest to średnia pozycyjna. |
Reprezentuje | Środek ciężkości zestawu danych | Środek ciężkości zestawu danych Punkt środkowy zestawu danych |
Możliwość zastosowania | Normalna dystrybucja | Przekrzywiony rozkład |
Wartości odstające | Średnia jest wrażliwa na wartości odstające. | Mediana nie jest wrażliwa na wartości odstające. |
Obliczenie | Średnia jest obliczana poprzez zsumowanie wszystkich obserwacji, a następnie podzielenie uzyskanej wartości przez liczbę obserwacji. | Aby obliczyć medianę, zestaw danych jest ułożony w porządku rosnącym lub malejącym, a następnie wartość, która mieści się dokładnie w środku nowego zestawu danych, jest medianą. |
Średnia jest szeroko stosowaną miarą tendencji centralnej, która jest definiowana jako średnia zbioru wartości. Reprezentuje model i najczęstszą wartość danego zakresu wartości. Można go obliczyć, zarówno w szeregach dyskretnych, jak i ciągłych.
Średnia jest równa sumie wszystkich obserwacji podzielonej przez liczbę obserwacji w zbiorze danych. Jeśli wartość przyjmowana przez zmienną jest równa, jej średnia również będzie taka sama. Średnia może być dwojakiego rodzaju, średnia próbki (x̅) i średnia populacji (µ). Można to obliczyć według podanego wzoru:
Mediana to kolejna ważna miara tendencji centralnej, stosowana do podziału wartości na dwie równe części, tj. Większą połowę próby, populację lub rozkład prawdopodobieństwa z dolnej połowy. Jest to najwyższa wartość środkowa, która jest osiągana, gdy obserwacje są sortowane w określonej kolejności, w porządku rosnącym lub malejącym.
Aby obliczyć medianę, najpierw ustaw obserwacje od najniższej do najwyższej lub od najwyższej do najniższej, a następnie zastosuj odpowiednią formułę zgodnie z poniższymi warunkami:
Istotne różnice między średnią a medianą podano w artykule podanym poniżej:
Znajdź średnią i medianę danego zestawu danych:
58, 26, 65, 34, 78, 44, 96
Rozwiązanie: Aby obliczyć średnią, należy podzielić sumę obserwacji przez liczbę obserwacji,
Średnia = 57,28
Aby obliczyć medianę, najpierw ustaw szereg w sekwencji, tj. Od najniższej do najwyższej,
26, 34, 44, 58, 65, 78, 96
gdzie n = liczba obserwacji
Mediana = 4th warunek = 58
Po przejrzeniu powyższych punktów możemy stwierdzić, że te dwa pojęcia matematyczne są różne. Średnia arytmetyczna lub średnia jest uważana za najlepszą miarę tendencji centralnej, ponieważ zawiera wszystkie cechy miary idealnej, ale ma jedną wadę polegającą na tym, że fluktuacje próbkowania wpływają na średnią.
W ten sam sposób mediana jest również jednoznacznie zdefiniowana oraz łatwa do zrozumienia i obliczenia, a najlepszą rzeczą w tym pomiarze jest to, że fluktuacje próbkowania nie mają na nią wpływu, ale jedyną wadą mediany jest to, że nie jest oparta na wszystkich obserwacje. W przypadku klasyfikacji z otwartym końcem mediana jest zwykle lepsza niż średnia.