Różnica między średnią a medianą

Średnia vs. mediana

Mediana jest liczbą reprezentującą „środek” danej próbki danych, która została ułożona numerycznie, biorąc pod uwagę, że próbka liczb jest nieparzysta po zliczeniu. W przypadku zestawu danych, który jest parzysty przy zliczaniu, mediana w tym przypadku jest pobierana dzieląc sumę dwóch środkowych liczb przez 2. Statystyka i teoria prawdopodobieństwa opisuje medianę jako wartość liczbową dzielącą próbkę na dwie równe połowy, tj. dolną połowę i wyższą połowę. Zbiór danych obejmuje próbkę i populację pośród innych.

W każdej próbce wyższa połowa będzie co najwyżej składać się z wartości większych niż mediana, podczas gdy dolna połowa będzie składać się z wartości mniejszych niż mediana. Jeśli obie „połówki” mają mniej niż połowę próbki, oznacza to, że część próbki będzie dokładnie równa medianie. Weźmy na przykład, jeśli x < z, then y will be the median of the sample x, y, z and if x < z

Mediana może być czasami używana do przedstawienia miary lokalizacji, w której rozkład jest ukośny, gdy ostatnie wartości nie są znane lub gdy wartości zewnętrzne nie są ważne, jeśli na przykład mogą powodować błędy pomiaru. Teoretycznie mediana jest bardzo trudna do opanowania i jest to poważna wada.

Średnia jest powszechnie (i błędnie) określana jako średnia, ale średnia nie zawsze jest równa średniej. Średnia „powszechna” to ta określana jako średnia, ale zdecydowanie średnia nie równa się średniej.
Z praktycznego punktu widzenia istnieje tylko marginalna różnica między medianą a średnią dla danej próbki, teoretycznie różnice mogą być wyraźne. Jednym z głównych faktów jest to, że różnicy między nimi nie można łatwo zrozumieć i jest to wspólne źródło zamieszania dla wielu ludzi. Dlatego słowo „średnia” jest często używane, gdy w rzeczywistym znaczeniu informacja miała reprezentować tryb lub medianę.

streszczenie
Mediana to środkowa liczba danego zestawu danych (jeśli jest nieparzysta), podczas gdy średnia jest definicją średniej arytmetycznej, która jest najczęściej cytowaną średnią.
Wartość mediany zależy od liczby elementów w zestawie danych (nieparzysta lub parzysta), podczas gdy średnia nie.