Uczenie nadzorowane i uczenie się bez nadzoru to dwie podstawowe koncepcje uczenia maszynowego. Uczenie nadzorowane to zadanie uczenia maszynowego polegające na uczeniu się funkcji, która odwzorowuje dane wejściowe na dane wyjściowe w oparciu o przykładowe pary danych wejściowych i wyjściowych. Uczenie się bez nadzoru to zadanie uczenia maszynowego polegające na wywodzeniu się z funkcji opisującej ukrytą strukturę na podstawie nieznakowanych danych. The kluczowa różnica jest to między uczeniem maszynowym nadzorowanym i bez nadzoru nadzorowane uczenie się korzysta z danych oznaczonych, natomiast uczenie się bez nadzoru korzysta z danych nieznakowanych.
Uczenie maszynowe to dziedzina informatyki, która umożliwia systemowi komputerowemu uczenie się na podstawie danych bez wyraźnego programowania. Pozwala to analizować dane i przewidywać wzorce w nich zawarte. Istnieje wiele zastosowań uczenia maszynowego. Niektóre z nich to rozpoznawanie twarzy, rozpoznawanie gestów i rozpoznawanie mowy. Istnieją różne algorytmy związane z uczeniem maszynowym. Niektóre z nich to regresja, klasyfikacja i grupowanie. Najpopularniejszymi językami programowania do tworzenia aplikacji opartych na uczeniu maszynowym są R i Python. Można także używać innych języków, takich jak Java, C ++ i Matlab.
1. Przegląd i kluczowa różnica
2. Co to jest uczenie nadzorowane
3. Co to jest uczenie się bez nadzoru
4. Podobieństwa między uczeniem maszynowym nadzorowanym i bez nadzoru
5. Porównanie obok siebie - Uczenie maszynowe pod nadzorem vs bez nadzoru w formie tabelarycznej
6. Podsumowanie
W systemach opartych na uczeniu maszynowym model działa zgodnie z algorytmem. W uczeniu nadzorowanym model jest nadzorowany. Po pierwsze, należy wyszkolić model. Dzięki zdobytej wiedzy potrafi przewidywać odpowiedzi na przyszłe przypadki. Model jest szkolony przy użyciu oznaczonego zestawu danych. Gdy system otrzymuje dane spoza próby, może przewidzieć wynik. Poniżej znajduje się mały wyciąg z popularnego zestawu danych IRIS.
Zgodnie z powyższą tabelą, długość oddzielania, szerokość oddzielania, długość patela, szerokość patela i gatunek są nazywane atrybutami. Kolumny są znane jako funkcje. Jeden wiersz zawiera dane dla wszystkich atrybutów. Dlatego jeden wiersz nazywa się obserwacją. Dane mogą być liczbowe lub kategoryczne. Model otrzymuje dane wejściowe z nazwami odpowiednich gatunków. Po przeprowadzeniu nowej obserwacji model powinien przewidzieć typ gatunku, do którego należy.
W uczeniu nadzorowanym istnieją algorytmy klasyfikacji i regresji. Klasyfikacja to proces klasyfikacji oznaczonych danych. Model stworzył granice, które oddzieliły kategorie danych. Gdy do modelu dostarczane są nowe dane, można je kategoryzować na podstawie tego, gdzie istnieje punkt. K-Nearest Neighbors (KNN) to model klasyfikacyjny. W zależności od wartości k decyduje się o kategorii. Na przykład, gdy k wynosi 5, jeśli konkretny punkt danych znajduje się w pobliżu ośmiu punktów danych w kategorii A i sześciu punktów danych w kategorii B, wówczas punkt danych zostanie sklasyfikowany jako A.
Regresja jest procesem przewidywania trendu poprzednich danych w celu przewidzenia wyniku nowych danych. W regresji dane wyjściowe mogą składać się z jednej lub większej liczby zmiennych ciągłych. Prognozowanie odbywa się za pomocą linii obejmującej większość punktów danych. Najprostszym modelem regresji jest regresja liniowa. Jest szybki i nie wymaga strojenia parametrów, takich jak KNN. Jeśli dane pokazują trend paraboliczny, model regresji liniowej nie jest odpowiedni.
Oto kilka przykładów nadzorowanych algorytmów uczenia się. Ogólnie wyniki uzyskane z nadzorowanych metod uczenia się są bardziej dokładne i wiarygodne, ponieważ dane wejściowe są dobrze znane i oznaczone. Dlatego maszyna musi analizować tylko ukryte wzory.
W uczeniu się bez nadzoru model nie jest nadzorowany. Model działa samodzielnie, aby przewidzieć wyniki. Wykorzystuje algorytmy uczenia maszynowego do wyciągania wniosków na temat nieznakowanych danych. Zasadniczo, algorytmy uczenia bez nadzoru są trudniejsze niż algorytmy uczenia nadzorowanego, ponieważ istnieje niewiele informacji. Klastrowanie jest rodzajem uczenia się bez nadzoru. Można go użyć do grupowania nieznanych danych za pomocą algorytmów. K-średnie i oparte na gęstości skupienia są dwoma algorytmami skupiania.
algorytm k-średnich, umieszcza k centroida losowo dla każdej grupy. Następnie każdy punkt danych jest przypisywany do najbliższego środka ciężkości. Odległość euklidesowa służy do obliczania odległości od punktu danych do środka ciężkości. Punkty danych są podzielone na grupy. Pozycje dla k centroidów są obliczane ponownie. Nowa pozycja środka ciężkości jest określana na podstawie średniej wszystkich punktów w grupie. Ponownie każdy punkt danych jest przypisany do najbliższego środka ciężkości. Ten proces powtarza się, aż centroidy już się nie zmienią. k-mean jest szybkim algorytmem grupowania, ale nie ma określonej inicjalizacji punktów grupowania. Istnieje również duża różnorodność modeli klastrowania opartych na inicjalizacji punktów skupień.
Kolejnym algorytmem grupowania jest Grupowanie oparte na gęstości. Znany jest również jako hałas w aplikacjach klastrowania przestrzennego opartych na gęstości. Działa poprzez zdefiniowanie klastra jako maksymalnego zestawu punktów związanych z gęstością. Są to dwa parametry stosowane w grupowaniu opartym na gęstości. Są to Ɛ (epsilon) i minimalna liczba punktów. Ɛ to maksymalny promień sąsiedztwa. Minimalna liczba punktów to minimalna liczba punktów w sąsiedztwie, aby zdefiniować klaster. Oto kilka przykładów grupowania, które popadają w uczenie się bez nadzoru.
Zasadniczo wyniki generowane przez nienadzorowane algorytmy uczenia się nie są zbyt dokładne i wiarygodne, ponieważ maszyna musi zdefiniować i oznaczyć dane wejściowe przed określeniem ukrytych wzorców i funkcji.
Uczone i nadzorowane uczenie maszynowe | |
Uczenie nadzorowane to zadanie uczenia maszynowego polegające na uczeniu się funkcji, która mapuje dane wejściowe na dane wyjściowe na podstawie przykładowych par danych wejściowych i wyjściowych. | Uczenie się bez nadzoru to zadanie uczenia maszynowego polegające na wywodzeniu się z funkcji opisującej ukrytą strukturę na podstawie nieznakowanych danych. |
Główna funkcjonalność | |
W nadzorowanym uczeniu model przewiduje wynik na podstawie oznaczonych danych wejściowych. | W uczeniu bez nadzoru model przewiduje wynik bez oznakowanych danych poprzez samodzielną identyfikację wzorców. |
Dokładność wyników | |
Wyniki uzyskane z nadzorowanych metod uczenia się są bardziej dokładne i wiarygodne. | Wyniki uzyskane z metod nauki bez nadzoru są mało dokładne i wiarygodne. |
Główne algorytmy | |
Istnieją algorytmy regresji i klasyfikacji w nadzorowanym uczeniu się. | Istnieją algorytmy grupowania w uczeniu się bez nadzoru. |
Uczenie nadzorowane i uczenie się bez nadzoru to dwa rodzaje uczenia maszynowego. Uczenie nadzorowane to zadanie uczenia maszynowego polegające na uczeniu się funkcji, która mapuje dane wejściowe na dane wyjściowe na podstawie przykładowych par danych wejściowych i wyjściowych. Uczenie się bez nadzoru to zadanie uczenia maszynowego polegające na wywodzeniu się z funkcji opisującej ukrytą strukturę na podstawie nieznakowanych danych. Różnica między nadzorowanym a nienadzorowanym uczeniem maszynowym polega na tym, że nadzorowane uczenie korzysta z danych oznaczonych, podczas gdy nienadzorowane przechylenie wykorzystuje dane nieoznaczone.
1.TheBigDataUniversity. Uczenie maszynowe - nadzorowane uczenie się bez nadzoru, klasa poznawcza, 13 marca 2017 r. Dostępne tutaj
2. „Uczenie się bez nadzoru”. Wikipedia, Wikimedia Foundation, 20 marca 2018 r. Dostępne tutaj
3. „Uczenie nadzorowane”. Wikipedia, Wikimedia Foundation, 15 marca 2018. Dostępne tutaj
1.'2729781 'przez GDJ (domena publiczna) przez pixabay