Semi Join vs Bloom Join
Częściowe łączenie i łączenie Bloom to dwie metody łączenia stosowane w przetwarzaniu zapytań dla rozproszonych baz danych. Podczas przetwarzania zapytań w rozproszonych bazach danych dane muszą być przesyłane między bazami danych znajdującymi się w różnych witrynach. Może to być kosztowna operacja w zależności od ilości danych, które należy przesłać. Dlatego podczas przetwarzania zapytań w środowisku rozproszonej bazy danych należy zoptymalizować zapytania, aby zminimalizować ilość danych przesyłanych między lokacjami. Częściowe łączenie i łączenie kwitnące to dwie metody, których można użyć do zmniejszenia ilości transferu danych i wydajnego przetwarzania zapytań.
Co to jest Semi Join?
Semi join to metoda stosowana do wydajnego przetwarzania zapytań w rozproszonych środowiskach baz danych. Rozważ sytuację, w której baza danych pracowników (przechowująca informacje, takie jak imię i nazwisko pracownika, numer działu, dla którego pracuje itp.) Znajduje się w lokacji 1, a baza danych departamentów (przechowująca informacje, takie jak numer działu, nazwa działu, lokalizacja itp.) 2. Na przykład, jeśli chcemy uzyskać nazwę pracownika i nazwę działu, dla którego ona pracuje (tylko dla oddziałów zlokalizowanych w „Nowym Jorku”), wykonując zapytanie w procesorze zapytań znajdującym się w ośrodku 3, istnieje kilka sposobów dane mogą być przesyłane między trzema lokalizacjami, aby zrealizować to zadanie. Ale przy przesyłaniu danych należy zauważyć, że nie jest konieczne przesyłanie całej bazy danych między stronami. Tylko niektóre atrybuty (lub krotki), które są wymagane do łączenia muszą zostać przesłane między stronami w celu wydajnego wykonania zapytania. Semi join to metoda, której można użyć do zmniejszenia ilości danych przesyłanych między stronami. W trybie łączenia częściowego tylko kolumna łączenia jest przenoszona z jednej witryny do drugiej, a następnie ta kolumna jest używana do zmniejszenia rozmiaru wysyłanych relacji między innymi witrynami. W powyższym przykładzie możesz po prostu przenieść numer działu i nazwę działu krotek o lokalizacji = „Nowy Jork” z witryny 2 do witryny 1 i wykonać połączenie w witrynie 1 i przenieść ostateczną relację z powrotem do witryny 3.
Czym jest Bloom Join?
Jak wspomniano wcześniej, łączenie Bloom jest kolejną metodą stosowaną w celu uniknięcia przesyłania niepotrzebnych danych między witrynami podczas wykonywania zapytań w środowiskach rozproszonej bazy danych. W łączeniu Bloom zamiast przenosić samą kolumnę łączenia, kompaktowa reprezentacja kolumny łączenia jest przenoszona między stronami. Łączenie Bloom wykorzystuje filtr Bloom, który wykorzystuje nieco wektor do wykonywania zapytań członkowskich. Po pierwsze, filtr Bloom jest budowany za pomocą kolumny łączenia i jest przenoszony między lokacjami, a następnie wykonywane są operacje łączenia.
Jaka jest różnica między Semi Join a Bloom Join?
Mimo że zarówno łączenie częściowe, jak i łączenie Bloom są stosowane w celu zminimalizowania ilości danych przesyłanych między stronami podczas wykonywania zapytań w środowisku rozproszonej bazy danych, łączenie Bloom zmniejsza ilość przesyłanych danych (liczbę krotek) w porównaniu z łączeniem częściowym przy użyciu koncepcja filtrów Bloom, które używają wektora bitowego do określania przynależności do zestawu. Dlatego użycie łączenia z łączeniem będzie bardziej wydajne niż łączenie z łączeniem.