Badacze społeczni często konstruują hipotezę, w której zakładają, że pewną ogólną regułę można zastosować do populacji. Testują tę hipotezę za pomocą testów, które mogą być parametryczne lub nieparametryczne. Testy parametryczne są zwykle bardziej powszechne i są badane znacznie wcześniej niż standardowe testy stosowane podczas przeprowadzania badań.
Proces przeprowadzania badań jest stosunkowo prosty - konstruujesz hipotezę i zakładasz, że pewne „prawo” można zastosować do populacji. Następnie przeprowadzasz test i gromadzisz dane, które następnie analizujesz statystycznie. Zebrane dane można zwykle przedstawić w postaci wykresu, a hipotezę stanowi średnią wartość tych danych. Jeśli hipotetyczne prawo i prawo wartości średniej są zgodne, hipoteza zostaje potwierdzona.
Jednak w niektórych przypadkach znalezienie wartości średniej nie jest najodpowiedniejszym sposobem poszukiwania prawa. Świetnym przykładem jest podział całkowitego dochodu. Jeśli nie dopasowałeś wartości średniej, to prawdopodobnie dlatego, że jeden lub dwóch miliarderów zaburza twoje wartości średnie. Jednak mediana da znacznie dokładniejszy wynik w stosunku do średniego dochodu, który jest bardziej prawdopodobny dla twoich danych.
Innymi słowy, test parametryczny zostanie zastosowany, gdy założenia dotyczące populacji będą jasne i będzie dostępnych wiele informacji na jego temat. Pytania zostaną zaprojektowane w celu zmierzenia tych konkretnych parametrów, aby dane mogły być następnie analizowane, jak opisano powyżej. Test nieparametryczny jest stosowany, gdy badana populacja nie jest całkowicie znana, a zatem badane parametry również są nieznane. Dodatkowo, podczas gdy test parametryczny wykorzystuje wartości średnie jako swoje wyniki, test nieparametryczny przyjmuje medianę i dlatego jest zwykle wykorzystywany, gdy pierwotna hipoteza nie pasuje do danych.
Test parametryczny jest testem mającym na celu dostarczenie danych, które następnie zostaną przeanalizowane w ramach dziedziny nauki zwanej statystyką parametryczną. Statystyka parametryczna zakłada, że pewne informacje o populacji są już znane, a mianowicie rozkład prawdopodobieństwa. Na przykład rozkład wysokości ciała na całym świecie jest opisany przez normalny model rozkładu. Podobnie do każdego znanego modelu dystrybucji można zastosować zestaw danych. Jednak założenie, że określony model dystrybucji pasuje do zestawu danych, oznacza, że z natury rzeczy zakładasz, że, jak wspomniałem, pewne dodatkowe informacje są znane na temat populacji. Rozkład prawdopodobieństwa zawiera różne parametry opisujące dokładny kształt rozkładu. Te parametry zapewniają testy parametryczne - każde pytanie jest dostosowane do podania dokładnej wartości określonego parametru dla każdej ankietowanej osoby. W połączeniu średnia wartość tego parametru jest używana do rozkładu prawdopodobieństwa. Oznacza to, że testy parametryczne również zakładają coś o populacji. Jeśli założenia są poprawne, statystyki parametryczne zastosowane do danych dostarczonych w teście parametrycznym dadzą wyniki, które są znacznie dokładniejsze i bardziej precyzyjne niż wyniki testu nieparametrycznego i statystyki.
Podobnie jak test parametryczny i statystyka, istnieje test nieparametryczny i statystyka. Są używane, gdy nie oczekuje się, że uzyskane dane będą pasować do normalnej krzywej rozkładu lub danych porządkowych. Doskonałym przykładem danych porządkowych jest przegląd, który pozostawiasz, gdy oceniasz dany produkt lub usługę w skali od 1 do 5. Dane porządkowe ogólnie uzyskuje się z testów, które wykorzystują różne rankingi lub zamówienia. Dlatego nie opiera się na liczbach ani dokładnych wartościach parametrów, na których polegały testy parametryczne. W rzeczywistości nie wykorzystuje parametrów w żaden sposób, ponieważ nie zakłada określonego rozkładu. Zazwyczaj analiza parametryczna jest lepsza niż analiza nieparametryczna, ale jeśli nie można wykonać testu parametrycznego z powodu nieznanej populacji, konieczne jest zastosowanie testów nieparametrycznych.
Jak wspomniałem, test parametryczny przyjmuje założenia dotyczące populacji. Potrzebuje parametrów związanych z rozkładem normalnym wykorzystywanym w analizie, a jedynym sposobem na poznanie tych parametrów jest posiadanie pewnej wiedzy na temat populacji. Z drugiej strony, test nieparametryczny, jak sama nazwa wskazuje, nie opiera się na żadnych parametrach i dlatego nie zakłada niczego o populacji.
Podstawą analizy statystycznej, która zostanie przeprowadzona na danych, w przypadku testów parametrycznych, jest rozkład probabilistyczny. Z drugiej strony podstawa testów nieparametrycznych nie istnieje - jest całkowicie arbitralna. Zapewnia to większą elastyczność i ułatwia dopasowanie hipotezy do zebranych danych.
Miarą tendencji centralnej jest centralna wartość w rozkładzie prawdopodobieństwa. I chociaż rozkład prawdopodobieństwa w przypadku statystyki nieparametrycznej jest arbitralny, nadal istnieje, a zatem również miara tendencji centralnej. Jednak środki te są różne. W przypadku testów parametrycznych przyjmuje się, że jest to wartość średnia, podczas gdy w przypadku testów nieparametrycznych przyjmuje się, że jest to wartość mediany.
Jak wspomniałem w pierwszej różnicy, informacje o populacji różnią się między parametrycznymi i nieparametrycznymi testami i statystykami. Mianowicie, pewna wiedza na temat populacji jest absolutnie niezbędna do analizy parametrycznej, ponieważ wymaga parametrów związanych z populacją, aby dać dokładne wyniki. Z drugiej strony można przyjąć podejście nieparametryczne bez wcześniejszej wiedzy o populacji.