Zarówno uczenie się głębokie, jak i wzmacniające są ściśle powiązane z mocą obliczeniową sztucznej inteligencji (AI). Są to autonomiczne funkcje uczenia maszynowego, które torują drogę komputerom do tworzenia własnych zasad przy opracowywaniu rozwiązań. Te dwa rodzaje uczenia się mogą również współistnieć w kilku programach. Zasadniczo dogłębne uczenie się wykorzystuje bieżące dane, podczas gdy uczenie się przez wzmocnienie wykorzystuje metodę prób i błędów przy obliczaniu prognoz. Poniższe dyskusje pogłębiają takie rozróżnienia.
Głębokie uczenie się jest również określane jako uczenie się głęboko ustrukturyzowane lub uczenie się hierarchiczne. Po raz pierwszy wprowadziła go w 1986 r. Profesor informatyki Rina Dechter. Wykorzystuje bieżące informacje w algorytmach nauczania do szukania odpowiednich wzorców, które są niezbędne w prognozowaniu danych. Taki system wykorzystuje różne poziomy sztucznych sieci neuronowych podobne do makijażu neuronalnego ludzkiego mózgu. Za pomocą skomplikowanych łączy algorytm może przetwarzać miliony informacji i wprowadzać bardziej szczegółowe prognozy.
Ten rodzaj uczenia się można zastosować, gdy programiści chcą, aby oprogramowanie wykrywało kolor fioletowy na różnych obrazach. Program byłby wówczas zasilany wieloma obrazami (stąd „głębokie” uczenie się) z fioletowymi kolorami i bez nich. Dzięki grupowaniu program będzie w stanie zidentyfikować wzory i dowiedzieć się, kiedy oznaczyć kolor jako fioletowy. Dogłębne uczenie się jest stosowane w różnych programach rozpoznawania, takich jak analizy obrazów i zadania prognostyczne, takie jak prognozy szeregów czasowych.
Uczenie się przez wzmocnienie ogólnie oblicza prognozy na podstawie prób i błędów. Jeśli chodzi o historię z punktu widzenia sztucznej inteligencji, został opracowany pod koniec lat osiemdziesiątych; został oparty na wynikach eksperymentów na zwierzętach, koncepcjach optymalnej kontroli i metodach różnic czasowych. Oprócz uczenia się nadzorowanego i bez nadzoru wzmocnienie jest jednym z podstawowych paradygmatów uczenia maszynowego. Jak sama nazwa wskazuje, algorytm jest szkolony poprzez nagrody.
Na przykład AI opracowano z myślą o grze z ludźmi w niektórych grach mobilnych. Za każdym razem, gdy AI traci, algorytm jest modyfikowany, aby zmaksymalizować jego wynik. Tak więc ta technika uczy się na błędach. Po wielu cyklach sztuczna inteligencja ewoluowała i stawała się lepsza w pokonywaniu ludzkich graczy. Uczenie się przez wzmocnienie jest stosowane w różnych najnowszych technologiach, takich jak ulepszanie robotyki, eksploracji tekstu i opieki zdrowotnej.
Dogłębne uczenie się jest w stanie zrealizować docelowe zachowanie, analizując istniejące dane i stosując zdobytą wiedzę do nowego zestawu informacji. Z drugiej strony uczenie się przez wzmocnienie może zmienić swoją reakcję poprzez dostosowanie ciągłego sprzężenia zwrotnego.
Dogłębne uczenie działa z już istniejącymi danymi, ponieważ jest to niezbędne przy szkoleniu algorytmu. Jeśli chodzi o uczenie się ze wzmocnieniem, ma ono charakter eksploracyjny i może być rozwijany bez bieżącego zestawu danych, ponieważ uczy się metodą prób i błędów.
Dogłębne uczenie się jest stosowane w rozpoznawaniu obrazu i mowy, głębokim szkoleniu wstępnym w sieci i zadaniach zmniejszania wymiarów. Dla porównania, uczenie się przez wzmocnienie jest wykorzystywane w interakcji z bodźcami zewnętrznymi z optymalną kontrolą, taką jak robotyka, planowanie wind, telekomunikacja, gry komputerowe i sztuczna inteligencja w służbie zdrowia.
Głębokie uczenie się jest również znane jako uczenie się hierarchiczne lub uczenie się głęboko ustrukturyzowane, podczas gdy uczenie się przez wzmacnianie nie ma innych powszechnie znanych terminów.
Głębokie uczenie się jest jedną z wielu metod uczenia maszynowego. Z drugiej strony uczenie się przez wzmocnienie jest dziedziną uczenia maszynowego; jest to jeden z trzech podstawowych paradygmatów.
W porównaniu do głębokiego uczenia się, uczenie się przez wzmocnienie jest bliższe możliwościom ludzkiego mózgu, ponieważ ten rodzaj inteligencji można ulepszyć za pomocą informacji zwrotnych. Głębokie uczenie się ma głównie na celu uznanie i jest mniej powiązane z interakcją.
Głębokie uczenie się zostało po raz pierwszy wprowadzone w 1986 r. Przez Rinę Dechter, podczas gdy uczenie się o wzmocnieniu zostało opracowane pod koniec lat 80. XX wieku w oparciu o koncepcje eksperymentów na zwierzętach, optymalnej kontroli i metod różnic czasowych.