Regresja liniowa a regresja logistyczna
W analizie statystycznej ważne jest zidentyfikowanie zależności między zmiennymi, których dotyczy badanie. Czasami może to być jedynym celem samej analizy. Jednym silnym narzędziem stosowanym do ustalenia istnienia związku i zidentyfikowania związku jest analiza regresji.
Najprostszą formą analizy regresji jest regresja liniowa, w której relacja między zmiennymi jest relacją liniową. Pod względem statystycznym ukazuje związek między zmienną objaśniającą a zmienną odpowiedzi. Na przykład za pomocą regresji możemy ustalić relację między ceną towaru a konsumpcją na podstawie danych zebranych z losowej próby. Analiza regresji wygeneruje funkcję regresji zbioru danych, który jest modelem matematycznym najlepiej pasującym do dostępnych danych. Można to łatwo przedstawić za pomocą wykresu rozrzutu. Regresja graficzna jest równoznaczna ze znalezieniem najlepszej krzywej dopasowania dla danego zestawu danych. Funkcją krzywej jest funkcja regresji. Za pomocą modelu matematycznego można przewidzieć użycie towaru dla danej ceny.
Dlatego analiza regresji jest szeroko stosowana w prognozowaniu i prognozowaniu. Służy również do ustalenia zależności w danych eksperymentalnych, w dziedzinie fizyki, chemii oraz w wielu naukach przyrodniczych i dyscyplinach inżynieryjnych. Jeśli relacja lub funkcja regresji jest funkcją liniową, wówczas proces jest znany jako regresja liniowa. Na wykresie rozproszenia można go przedstawić jako linię prostą. Jeśli funkcja nie jest liniową kombinacją parametrów, regresja jest nieliniowa.
Regresja logistyczna jest porównywalna z regresją wielowymiarową i tworzy model wyjaśniający wpływ wielu predyktorów na zmienną odpowiedzi. Jednak w regresji logistycznej zmienna wyniku końcowego powinna być kategoryczna (zwykle podzielona; tj. Para możliwych do osiągnięcia wyników, takich jak śmierć lub przeżycie, chociaż specjalne techniki umożliwiają modelowanie bardziej skategoryzowanych informacji). Ciągłą zmienną wynikową można przekształcić w zmienną kategoryczną, która zostanie wykorzystana do regresji logistycznej; jednak zawijanie zmiennych ciągłych w ten sposób jest najczęściej odradzane, ponieważ zmniejsza dokładność.
W przeciwieństwie do regresji liniowej, w kierunku średniej zmienne predykcyjne w regresji logistycznej nie muszą być zmuszane do liniowego łączenia, powszechnego rozkładu lub do równej wariancji w każdym klastrze. W rezultacie relacja między zmiennymi predykcyjnymi a zmiennymi wynikowymi prawdopodobnie nie będzie funkcją liniową.
Jaka jest różnica między regresją logistyczną a regresją liniową?
• W regresji liniowej zakłada się zależność liniową między zmienną objaśniającą a zmienną odpowiedzi, a parametry spełniające model są analizowane, aby dać dokładną zależność.
• Dla zmiennych ilościowych przeprowadzana jest regresja liniowa, a wynikową funkcją jest funkcja ilościowa.
• W regresji logistycznej wykorzystywane dane mogą być jakościowe lub ilościowe, ale wynik jest zawsze kategoryczny.