Średni vs Mediana vs Tryb
Średnia, mediana i tryb są pierwszorzędne miary tendencji centralnej stosowane w statystykach opisowych. Różnią się one całkowicie od siebie, a przypadki, w których są wykorzystywane do podsumowania danych, są również różne.
Oznaczać
Średnia arytmetyczna to suma wartości danych podzielona przez liczbę wartości danych, tj.
Jeśli dane pochodzą z przestrzeni próbki, nazywa się to średnią próbki (), która jest opisową statystyką próby. Chociaż jest to najczęściej stosowana miara opisowa dla próbki, nie jest to solidna statystyka. Jest bardzo wrażliwy na wartości odstające i oscylacyjne.
Weźmy na przykład średni dochód mieszkańców danego miasta. Ponieważ wszystkie wartości danych są sumowane, a następnie dzielone, dochód osoby bardzo zamożnej znacząco wpływa na średnią. Dlatego średnie wartości nie zawsze stanowią dobrą reprezentację danych.
Również w przypadku sygnału przemiennego prąd przepływający przez element zmienia się okresowo od kierunku dodatniego do kierunku ujemnego i odwrotnie. Jeśli weźmiemy średni prąd przepływający przez element w jednym okresie, da to 0, co oznacza, że żaden prąd nie przepłynął przez element, co oczywiście nie jest prawdą. Dlatego też w tym przypadku średnia arytmetyczna nie jest dobrą miarą.
Średnia arytmetyczna jest dobrym wskaźnikiem, gdy dane są równomiernie rozłożone. Dla rozkładu normalnego średnia jest równa trybowi i medianie. Ma również najniższe wartości resztkowe, biorąc pod uwagę błąd pierwiastkowy do kwadratu; dlatego najlepszym środkiem opisowym, gdy wymagane jest reprezentowanie zestawu danych za pomocą pojedynczej liczby.
Mediana
Wartości środkowego punktu danych po ułożeniu wszystkich wartości danych w porządku rosnącym są zdefiniowane jako mediana zestawu danych. Mediana to 2. kwartyl, 5. decyl i 50 percentyl.
• Jeśli liczba obserwacji (punktów danych) jest nieparzysta, wówczas mediana jest obserwacją dokładnie na środku uporządkowanej listy.
• Jeśli liczba obserwacji (punktów danych) jest parzysta, to mediana jest średnią z dwóch środkowych obserwacji na uporządkowanej liście.
Mediana dzieli obserwację na dwie grupy; tj. grupa (50%) wartości wyższych i grupa (50%) wartości niższych niż mediana. Mediany są szczególnie stosowane w przekrzywionych rozkładach i reprezentują dane znacznie lepsze niż średnia arytmetyczna.
Tryb
Tryb jest najczęściej występującą liczbą w zestawie obserwacji. Tryb zbioru danych jest obliczany przez znalezienie częstotliwości każdego elementu w zestawie.
• Jeśli żadna wartość nie wystąpi więcej niż jeden raz, wówczas zestaw danych nie ma trybu.
• W przeciwnym razie każda wartość występująca z największą częstotliwością jest trybem zestawu danych.
W zestawie może istnieć więcej niż jeden tryb; dlatego tryb nie jest unikalną statystyką zestawu danych. W jednolitym rozkładzie istnieje jeden tryb. Tryb dyskretnego rozkładu prawdopodobieństwa to punkt, w którym funkcja masy prawdopodobieństwa osiąga najwyższy punkt. Na podstawie powyższych interpretacji możemy to powiedzieć globalne maksima są tryby.
Rozważ zastosowanie wszystkich trzech środków do następującego zestawu danych.
DANE: 1, 1, 2, 3, 5, 5, 5, 5, 6, 6, 8, 8, 9, 9, 9, 9, 9, 10, 10, 10, 14, 14, 15, 15 , 15
Średnia = (1+ 1+ 2+ 3+ 5+ 5+ 5+ 5+ 6+ 6+ 8+ 8+ 9+ 9+ 9+ 9+ 10+ 10+ 10+ 14+ 14+ 15+ 15+ 15 ) / 25 = 8,12
Mediana = 9 (13. element)
Tryb = 9 (częstotliwość 9 = 5)
Jaka jest różnica między średnią, medianą i trybem?
• Średnia arytmetyczna to suma wartości (obserwacji) podzielona przez liczbę obserwacji. Nie jest to solidna statystyka i silnie zależy od normalnego charakteru rozkładu w rozważanym rozkładzie. Pojedyncza wartość odstająca może spowodować znaczące przesunięcie średniej, dając względnie wprowadzające w błąd wartości. Pojęcie to można rozszerzyć na średnią geometryczną, średnią harmoniczną, średnią ważoną i tak dalej.
• Mediana to średnie wartości zbioru obserwacji i na wartości odstające mają stosunkowo mniejszy wpływ. Może to dać dobre oszacowanie jako statystyka podsumowująca w bardzo wypaczonych przypadkach.
• Tryb to najczęstsze wartości obserwacji w zbiorze danych. Jeśli rozkład jest przekrzywiony dodatnio, tryb leży w lewo do mediany, a jeśli jest przekrzywiony ujemnie, tryb leży w prawo do mediany.
• Jeśli jest pozytywnie wypaczony, średnia jest odpowiednia do mediany; jeśli ujemnie wypaczona średnia jest po lewej stronie mediany.
• W rozkładzie normalnym wszystkie trzy, średnia, tryb i mediana są równe.