Słowo dane odnosi się do informacji, które są gromadzone i rejestrowane. Może mieć postać liczb, słów, pomiarów i wiele innych.
Istnieją dwa rodzaje danych i są to dane jakościowe i ilościowe. Różnica między tymi dwoma typami danych polega na tym, że dane ilościowe są wykorzystywane do opisu informacji liczbowych. Na przykład pomiar temperatury byłby objęty tego rodzaju danymi.
Z drugiej strony dane jakościowe są wykorzystywane do opisania informacji słowami. Po zebraniu danych należy je zorganizować, stąd potrzeba oddzielenia danych zgrupowanych od danych niepogrupowanych. Oba są użytecznymi formami danych, ale różnica między nimi polega na tym, że niepogrupowane dane są danymi surowymi. Oznacza to, że został właśnie zebrany, ale nie posortowany w żadnej grupie lub klasach. Z drugiej strony dane pogrupowane to dane, które zostały uporządkowane w grupy na podstawie nieprzetworzonych danych.
Jak wspomniano powyżej, zgrupowane dane to rodzaj danych, które po zebraniu są klasyfikowane w grupy. Surowe dane są podzielone na różne grupy i tworzona jest tabela. Podstawowym celem tabeli jest pokazanie punktów danych występujących w każdej grupie. Na przykład po zakończeniu testu wyniki są danymi w tym scenariuszu i istnieje wiele sposobów grupowania tych danych. Na przykład można zapisać liczbę studentów, którzy uzyskali punktację powyżej 20 punktów.
Alternatywnie można zastosować oceny. Na przykład 90-100 aż do F 0-59 z każdą kategorią pokazującą, ilu studentów jest w każdej kategorii. Histogramy i tabele częstotliwości najlepiej stosować do wyświetlania i interpretacji zgrupowanych danych. Oto przykład
Grupowanie danych ma następujące zalety:
Dane niepogrupowane, zwane również danymi surowymi, to dane, które nie zostały umieszczone w żadnej grupie lub kategorii po zebraniu. Dane są podzielone na liczby lub cechy, dlatego dane, które nie zostały umieszczone w żadnej z kategorii, nie są pogrupowane. Na przykład, przeprowadzając spis ludności i chcąc przeanalizować, ile kobiet w wieku powyżej 45 lat przebywa w danym obszarze, najpierw musisz wiedzieć, ile osób mieszka w tym obszarze.
Liczba osób mieszkających w tym obszarze to niepogrupowane dane lub surowe informacje, ponieważ nic nie zostało skategoryzowane. Możemy zatem stwierdzić, że dane niepogrupowane to dane używane do przedstawienia informacji o poszczególnych członkach próby lub populacji.
Niektóre zalety niepogrupowanych danych są następujące;
Dane pogrupowane to dane zorganizowane w klasy po ich analizie. Przykłady obejmują liczbę worków kukurydzy zebranych w porze deszczowej, które były złe. Z drugiej strony niezgrupowane dane to dane, które nie należą do żadnej grupy. To wciąż surowe dane.
Podczas zbierania danych preferowane są dane niepogrupowane, ponieważ informacje są nadal w oryginalnej formie. Nie zostało zmienione przez klasyfikację lub podział. Jednak podczas analizy i rysowania wykresów preferowane są zgrupowane dane, ponieważ można je łatwo interpretować.
Przy obliczaniu średnich zgrupowanych i niepogrupowanych danych wystąpi zmiana. Preferowana jest średnia zgrupowanych danych, ponieważ jest bardziej dokładna niż średnia z niezgrupowanych danych. Średnia z niezgrupowanych danych może prowadzić do niewłaściwej manipulacji medianą, dlatego w większości przypadków uważa się ją za nieefektywną.
Tabele częstotliwości służą do wyświetlania informacji zgrupowanych danych, natomiast w przypadku danych niepogrupowanych informacje wyglądają jak duża lista liczb. Wynika to z faktu, że informacje są nadal surowe.
Dane pogrupowane to dane zorganizowane w rozkład częstotliwości, natomiast dane niepogrupowane nie zostały w żaden sposób podsumowane.