Uczenie maszynowe to zestaw metod używanych do tworzenia programów komputerowych, które mogą uczyć się na podstawie obserwacji i przewidywać. Uczenie maszynowe wykorzystuje algorytmy, regresje i pokrewne nauki do zrozumienia danych. Algorytmy te można ogólnie traktować jako modele statystyczne i sieci.
Głębokie uczenie się jest podzbiorem metod uczenia maszynowego. Dane są analizowane przez wiele warstw sieci głębokiego uczenia, dzięki czemu sieć może wyciągać wnioski i podejmować decyzje dotyczące danych. Metody głębokiego uczenia pozwalają na dużą dokładność dużych zbiorów danych, ale te funkcje sprawiają, że głębokie uczenie wymaga znacznie więcej zasobów niż klasyczne uczenie maszynowe.
Przez kilka dziesięcioleci uczenie maszynowe było stosowane jako metoda uzyskiwania sztucznej inteligencji w maszynach. Zasadniczo dziedzina uczenia maszynowego koncentruje się na tworzeniu komputerów, które potrafią się uczyć i podejmować decyzje, co sprawia, że uczenie maszynowe jest odpowiednie do badań nad sztuczną inteligencją. Jednak nie wszystkie modele uczenia maszynowego mają na celu rozwijanie „prawdziwej” sztucznej inteligencji, która doskonale odpowiada ludzkiej inteligencji lub ją przewyższa. Zamiast tego modele są często zaprojektowane do badania konkretnych, ograniczonych problemów.
Głębokie uczenie się zaproponowano na wczesnych etapach dyskusji na temat uczenia maszynowego, ale niewielu badaczy stosowało metody głębokiego uczenia się, ponieważ wymagania obliczeniowe głębokiego uczenia się są znacznie większe niż w klasycznym uczeniu maszynowym. Jednak moc obliczeniowa komputerów wzrosła wykładniczo od 2000 r., Umożliwiając badaczom dokonanie ogromnych ulepszeń w uczeniu maszynowym i budowie sztucznej inteligencji. Ponieważ modele głębokiego uczenia się dobrze skalują się ze zwiększoną ilością danych, głębokie uczenie się może potencjalnie pokonać znaczące przeszkody w tworzeniu prawdziwej sztucznej inteligencji.
Uczenie maszynowe i głębokie uczenie się są algorytmiczne. W klasycznym uczeniu maszynowym badacze wykorzystują stosunkowo niewielką ilość danych i decydują, jakie najważniejsze cechy są w danych, których algorytm potrzebuje do prognozowania. Ta metoda nazywa się inżynierią funkcji. Na przykład, jeśli nauczono program uczenia maszynowego do rozpoznawania obrazu samolotu, jego programiści stworzyliby algorytmy, które pozwolą programowi rozpoznać typowe kształty, kolory i rozmiary samolotów komercyjnych. Dzięki tym informacjom program uczenia maszynowego przewidziałby, czy obrazy zostaną przedstawione wraz z dołączonymi samolotami.
Głębokie uczenie się zasadniczo różni się od klasycznego uczenia maszynowego wieloma etapami podejmowania decyzji. Sieci do głębokiego uczenia się są często uważane za „czarne skrzynki”, ponieważ dane są analizowane przez wiele warstw sieci, z których każda dokonuje obserwacji. Może to utrudnić zrozumienie wyników niż w klasycznym uczeniu maszynowym. Dokładna liczba warstw lub kroków w podejmowaniu decyzji zależy od rodzaju i złożoności wybranego modelu.
Uczenie maszynowe tradycyjnie wykorzystuje małe zbiory danych, z których można się uczyć i przewidywać. Przy niewielkiej ilości danych badacze mogą określić precyzyjne funkcje, które pomogą programowi uczenia maszynowego zrozumieć dane i wyciągnąć z nich wnioski. Jeśli jednak program napotka informacje, których nie może sklasyfikować na podstawie wcześniej istniejących algorytmów, badacze zazwyczaj będą musieli ręcznie przeanalizować problematyczne dane i utworzyć nową funkcję. Z tego powodu klasyczne uczenie maszynowe zwykle nie skaluje się dobrze przy dużych ilościach danych, ale może zminimalizować błędy w mniejszych zestawach danych.
Dogłębne uczenie się jest szczególnie przydatne w przypadku dużych zestawów danych, a modele często wymagają dużych zestawów danych, aby były przydatne. Ze względu na złożoność sieci do głębokiego uczenia się, sieć potrzebuje znacznej ilości danych szkoleniowych i dodatkowych danych do przetestowania sieci po treningu. Obecnie naukowcy udoskonalają sieci głębokiego uczenia się, które mogą być bardziej wydajne i wykorzystywać mniejsze zestawy danych.
Uczenie maszynowe ma zmienne wymagania dotyczące wydajności komputera. Istnieje wiele modeli, które można uruchomić na przeciętnym komputerze osobistym. Im bardziej zaawansowane są metody statystyczne i matematyczne, tym trudniej jest komputerowi szybko przetwarzać dane.
Głębokie uczenie się wymaga zwykle dużych nakładów. Analiza dużych ilości informacji w wielu warstwach decyzyjnych wymaga dużej mocy obliczeniowej. Ponieważ komputery stają się szybsze, głębokie uczenie się jest coraz bardziej dostępne.
Tradycyjnie uczenie maszynowe ma kilka wspólnych i znaczących ograniczeń. Nadmierne dopasowanie to problem statystyczny, który może wpływać na algorytm uczenia maszynowego. Algorytm uczenia maszynowego zawiera pewną ilość „błędu” podczas analizy i przewidywania za pomocą danych. Algorytm ma pokazywać związek między odpowiednimi zmiennymi, ale w przypadku przeregulowania zaczyna również wychwytywać błąd, co prowadzi do „głośniejszego” lub niedokładnego modelu. Modele uczenia maszynowego mogą również stać się stronnicze w stosunku do specyfiki danych, z którymi zostali przeszkoleni, co jest szczególnie widoczne, gdy badacze trenują algorytmy na całym dostępnym zestawie danych zamiast zapisywać część danych w celu przetestowania algorytmu.
Głębokie uczenie się ma te same pułapki statystyczne, co klasyczne uczenie maszynowe, a także kilka unikalnych problemów. W przypadku wielu problemów brakuje wystarczających danych, aby wyszkolić dość dokładną sieć głębokiego uczenia. Często gromadzenie większej ilości danych lub symulowanie rzeczywistego problemu jest często zbyt kosztowne lub niemożliwe, co ogranicza obecny zakres tematów, w których można zastosować głębokie uczenie się.
Uczenie maszynowe i głębokie uczenie opisują metody uczenia komputerów uczenia się i podejmowania decyzji. Głębokie uczenie się jest podzbiorem klasycznego uczenia maszynowego, a niektóre ważne rozbieżności sprawiają, że głębokie uczenie się i uczenie maszynowe są odpowiednie dla różnych zastosowań.