The kluczowa różnica drzewo klasyfikacji i regresji jest tym w klasyfikacji zmienne zależne są kategoryczne i nieuporządkowane, podczas gdy w regresji zmienne zależne są ciągłe lub uporządkowane wartości całkowite.
Klasyfikacja i regresja to techniki uczenia się służące do tworzenia modeli przewidywania na podstawie zebranych danych. Obie techniki są przedstawione graficznie jako drzewa klasyfikacji i regresji, a raczej schematy blokowe z podziałem danych po każdym kroku, a raczej „gałąź” w drzewie. Ten proces nazywa się partycjonowaniem rekurencyjnym. Dziedziny takie jak górnictwo wykorzystują te techniki uczenia się w oparciu o klasyfikację i regresję. W tym artykule skupiono się na drzewie klasyfikacji i drzewie regresji.
1. Przegląd i kluczowa różnica
2. Co to jest klasyfikacja
3. Co to jest regresja
4. Porównanie obok siebie - Klasyfikacja a regresja w formie tabelarycznej
5. Podsumowanie
Klasyfikacja to technika stosowana do uzyskania schematu, który pokazuje organizację danych, począwszy od zmiennej prekursorowej. Zmienne zależne klasyfikują dane.
Rysunek 01: Wyszukiwanie danych
Drzewo klasyfikacji rozpoczyna się od zmiennej niezależnej, która rozgałęzia się na dwie grupy zgodnie z istniejącymi zmiennymi zależnymi. Ma to na celu wyjaśnienie odpowiedzi w formie kategoryzacji wywołanej przez zmienne zależne.
Regresja jest metodą przewidywania opartą na założonej lub znanej liczbowej wartości wyjściowej. Ta wartość wyjściowa jest wynikiem serii partycjonowania rekurencyjnego, przy czym każdy krok ma jedną wartość liczbową i inną grupę zmiennych zależnych, które rozgałęziają się na inną parę, taką jak ta.
Drzewo regresji zaczyna się od jednej lub więcej zmiennych prekursorowych, a kończy jedną końcową zmienną wyjściową. Zmienne zależne są ciągłymi lub dyskretnymi zmiennymi numerycznymi.
Klasyfikacja a regresja | |
Model drzewa, w którym zmienna docelowa może przyjmować dyskretny zestaw wartości. | Model drzewa, w którym zmienna docelowa może przyjmować ciągłe wartości, zwykle liczby rzeczywiste. |
Zmienna zależna | |
W przypadku drzewa klasyfikacji zmienne zależne są jakościowe. | W przypadku drzewa regresji zmienne zależne są numeryczne. |
Wartości | |
Ma określoną liczbę nieuporządkowanych wartości. | Ma albo wartości dyskretne, ale uporządkowane, albo wartości niedyskretne. |
Cel budowy | |
Celem budowy drzewa regresji jest dopasowanie systemu regresji do każdej gałęzi determinant w taki sposób, aby pojawiała się oczekiwana wartość wyjściowa. | Drzewo klasyfikacji rozgałęzia się, jak określono przez zmienną zależną pochodzącą z poprzedniego węzła. |
Drzewa regresji i klasyfikacji są pomocnymi technikami mapowania procesu, który wskazuje na badany wynik, zarówno w klasyfikacji, jak i pojedynczej wartości liczbowej. Różnica między drzewem klasyfikacji a drzewem regresji jest ich zmienna zależna. Drzewa klasyfikacji mają zmienne zależne, które są kategoryczne i nieuporządkowane. Drzewa regresji mają zmienne zależne, które są wartościami ciągłymi lub uporządkowanymi wartościami całkowitymi.
1. „Uczenie się w drzewie decyzyjnym”. Wikipedia, Fundacja Wikimedia, 13 maja 2018 r. Dostępne tutaj
1.'Data Mining'By Arbeck - Praca własna, (CC BY 3.0) przez Commons Wikimedia