Różnica między klasyfikacją a regresją

The kluczowa różnica drzewo klasyfikacji i regresji jest tym w klasyfikacji zmienne zależne są kategoryczne i nieuporządkowane, podczas gdy w regresji zmienne zależne są ciągłe lub uporządkowane wartości całkowite.

Klasyfikacja i regresja to techniki uczenia się służące do tworzenia modeli przewidywania na podstawie zebranych danych. Obie techniki są przedstawione graficznie jako drzewa klasyfikacji i regresji, a raczej schematy blokowe z podziałem danych po każdym kroku, a raczej „gałąź” w drzewie. Ten proces nazywa się partycjonowaniem rekurencyjnym. Dziedziny takie jak górnictwo wykorzystują te techniki uczenia się w oparciu o klasyfikację i regresję. W tym artykule skupiono się na drzewie klasyfikacji i drzewie regresji.

ZAWARTOŚĆ

1. Przegląd i kluczowa różnica
2. Co to jest klasyfikacja
3. Co to jest regresja
4. Porównanie obok siebie - Klasyfikacja a regresja w formie tabelarycznej
5. Podsumowanie

Co to jest klasyfikacja?

Klasyfikacja to technika stosowana do uzyskania schematu, który pokazuje organizację danych, począwszy od zmiennej prekursorowej. Zmienne zależne klasyfikują dane.

Rysunek 01: Wyszukiwanie danych

Drzewo klasyfikacji rozpoczyna się od zmiennej niezależnej, która rozgałęzia się na dwie grupy zgodnie z istniejącymi zmiennymi zależnymi. Ma to na celu wyjaśnienie odpowiedzi w formie kategoryzacji wywołanej przez zmienne zależne.

Co to jest regresja

Regresja jest metodą przewidywania opartą na założonej lub znanej liczbowej wartości wyjściowej. Ta wartość wyjściowa jest wynikiem serii partycjonowania rekurencyjnego, przy czym każdy krok ma jedną wartość liczbową i inną grupę zmiennych zależnych, które rozgałęziają się na inną parę, taką jak ta.

Drzewo regresji zaczyna się od jednej lub więcej zmiennych prekursorowych, a kończy jedną końcową zmienną wyjściową. Zmienne zależne są ciągłymi lub dyskretnymi zmiennymi numerycznymi.

Jaka jest różnica między klasyfikacją a regresją?

 Klasyfikacja a regresja

Model drzewa, w którym zmienna docelowa może przyjmować dyskretny zestaw wartości. Model drzewa, w którym zmienna docelowa może przyjmować ciągłe wartości, zwykle liczby rzeczywiste.
Zmienna zależna
W przypadku drzewa klasyfikacji zmienne zależne są jakościowe. W przypadku drzewa regresji zmienne zależne są numeryczne.
Wartości
Ma określoną liczbę nieuporządkowanych wartości. Ma albo wartości dyskretne, ale uporządkowane, albo wartości niedyskretne.
Cel budowy
Celem budowy drzewa regresji jest dopasowanie systemu regresji do każdej gałęzi determinant w taki sposób, aby pojawiała się oczekiwana wartość wyjściowa. Drzewo klasyfikacji rozgałęzia się, jak określono przez zmienną zależną pochodzącą z poprzedniego węzła.

Podsumowanie - Klasyfikacja a regresja

Drzewa regresji i klasyfikacji są pomocnymi technikami mapowania procesu, który wskazuje na badany wynik, zarówno w klasyfikacji, jak i pojedynczej wartości liczbowej. Różnica między drzewem klasyfikacji a drzewem regresji jest ich zmienna zależna. Drzewa klasyfikacji mają zmienne zależne, które są kategoryczne i nieuporządkowane. Drzewa regresji mają zmienne zależne, które są wartościami ciągłymi lub uporządkowanymi wartościami całkowitymi.

Odniesienie:

1. „Uczenie się w drzewie decyzyjnym”. Wikipedia, Fundacja Wikimedia, 13 maja 2018 r. Dostępne tutaj 

Zdjęcie dzięki uprzejmości:

1.'Data Mining'By Arbeck - Praca własna, (CC BY 3.0) przez Commons Wikimedia