The kluczowa różnica między RDBMS i Hadoop jest to, że RDBMS przechowuje uporządkowane dane, podczas gdy Hadoop przechowuje uporządkowane, częściowo ustrukturyzowane i nieustrukturyzowane dane.
RDBMS to system zarządzania bazą danych oparty na modelu relacyjnym. Hadoop to oprogramowanie do przechowywania danych i uruchamiania aplikacji na klastrach sprzętu towarowego.
1. Przegląd i kluczowa różnica
2. Co to jest RDBMS
3. Co to jest Hadoop
4. Porównanie obok siebie - RDBMS vs Hadoop w formie tabeli
5. Podsumowanie
RDBMS oznacza Relational Database Management System oparty na modelu relacyjnym. W RDBMS tabele służą do przechowywania danych, a klucze i indeksy pomagają połączyć tabele. Tabela to zbiór elementów danych, które są jednostkami. Zawiera wiersze i kolumny. Wiersze reprezentują pojedynczy wpis w tabeli. Kolumny reprezentują atrybuty.
Na przykład baza danych sprzedaży może zawierać podmioty klientów i produktów. Klient może mieć takie atrybuty, jak identyfikator_użytkownika, nazwa, adres, nr telefonu. Element może mieć atrybuty takie jak id_produktu, nazwa itp. Podstawowym kluczem tabeli klientów jest identyfikator_użytkownika, a kluczem podstawowym tabeli produktów jest identyfikator_produktu. Umieszczenie id_produktu w tabeli klientów jako klucz obcy łączy te dwa podmioty. Podobnie tabele są ze sobą powiązane. Zapewniają integralność danych, normalizację i wiele innych. Niewiele wspólnych RDBMS to MySQL, MSSQL i Oracle. Używają SQL do wysyłania zapytań.
Hadoop to platforma open source Apache napisana w Javie. Pomaga przechowywać i przetwarzać dużą ilość danych w klastrach komputerów przy użyciu prostych modeli programowania. Głównym celem Hadoop jest przechowywanie i przetwarzanie Big Data, co odnosi się do dużej liczby złożonych danych. Przepustowość Hadoop, czyli zdolność do przetwarzania ilości danych w określonym przedziale czasu, jest wysoka.
Istnieją cztery moduły w architekturze Hadoop. Są one wspólne dla Hadoop, YARN, Hadoop Distributed File System (HDFS) i Hadoop MapReduce. Wspólny moduł zawiera biblioteki Java i narzędzia. Zawiera także pliki do uruchomienia Hadoop. Hadoop YARN wykonuje planowanie zadań i zarządzanie zasobami klastra.
Ponadto Hadoop Distributed File System (HDFS) to system pamięci masowej Hadoop. Wykorzystuje architekturę master-slave. Węzeł główny to NameNode, który zarządza metadanymi systemu plików. Inne komputery są węzłami podrzędnymi lub węzłami danych. Przechowują rzeczywiste dane. Z drugiej strony Hadoop MapReduce wykonuje obliczenia rozproszone. Ma algorytmy do przetwarzania danych. W HDFS węzeł główny ma moduł śledzenia zadań. Uruchamia zadania zmniejszania mapy w węzłach podrzędnych. Dla każdego węzła podrzędnego istnieje moduł do śledzenia zadań, który kończy przetwarzanie danych i odsyła wynik z powrotem do węzła głównego. Ogólnie rzecz biorąc, Hadoop zapewnia masowe przechowywanie danych o wysokiej mocy przetwarzania.
RDBMS vs Hadoop | |
RDBMS to oprogramowanie systemowe do tworzenia baz danych i zarządzania nimi w oparciu o model relacyjny. | Hadoop to kolekcja oprogramowania typu open source, które łączy wiele komputerów w celu rozwiązywania problemów związanych z dużą ilością danych i obliczeń. |
Różnorodność danych | |
RDBMS przechowuje uporządkowane dane. | Hadoop przechowuje uporządkowane, częściowo ustrukturyzowane i nieustrukturyzowane dane. |
Przechowywanie danych | |
RDBMS przechowuje średnią ilość danych. | Hadoop przechowuje dużą ilość danych niż RDBMS. |
Prędkość | |
W RDBMS odczyty są szybkie. | W Hadoop czytanie i pisanie jest szybkie. |
Skalowalność | |
RDBMS ma skalowalność pionową. | Hadoop ma skalowalność poziomą. |
Sprzęt komputerowy | |
RDBMS korzysta z wysokiej klasy serwerów. | Hadoop używa sprzętu towarowego. |
Wydajność | |
Przepustowość RDBMS jest wyższa. | Wydajność Hadoop jest niższa. |
W tym artykule omówiono różnicę między RDBMS a Hadoop. Kluczowa różnica między RDBMS i Hadoop polega na tym, że RDBMS przechowuje uporządkowane dane, podczas gdy Hadoop przechowuje uporządkowane, częściowo ustrukturyzowane i nieustrukturyzowane dane.
1.Poradnik punkt. „Pojęcia dotyczące SQL RDBMS”. , Tutorials Point, 8 stycznia 2018 r. Dostępne tutaj
2.Punkt przewodnika. „Samouczek Hadoop”. , Tutorials Point, 8 stycznia 2018 r. Dostępne tutaj
1.'8552968000 'przez Intel Free Press (CC BY-SA 2.0) przez Flickr