Korelacja a kowariancja
Korelacja i kowariancja to ściśle powiązane pojęcia w statystyce teoretycznej. Są ważne przy określaniu związku między dwiema zmiennymi losowymi.
Co to jest korelacja?
Korelacja jest miarą siły zależności między dwiema zmiennymi. Współczynnik korelacji określa stopień zmiany jednej zmiennej na podstawie zmiany drugiej zmiennej. W statystyce korelacja wiąże się z pojęciem zależności, która jest statystyczną zależnością między dwiema zmiennymi
Współczynnik korelacji Pearsona lub po prostu współczynnik korelacji r jest wartością między -1 a 1 (-1≤r≤ + 1). Jest to najczęściej stosowany współczynnik korelacji i obowiązuje tylko dla liniowej zależności między zmiennymi. Jeśli r = 0, nie istnieje związek, a jeśli r≥0, związek jest wprost proporcjonalny; wartość jednej zmiennej rośnie wraz ze wzrostem drugiej. Jeżeli r≤0 związek jest odwrotnie proporcjonalny; jedna zmienna maleje wraz ze wzrostem drugiej.
Ze względu na warunek liniowości współczynnik korelacji r można również zastosować do ustalenia obecności zależności liniowej między zmiennymi.
Co to jest kowariancja?
W teorii statystycznej kowariancja jest miarą zmiany dwóch zmiennych losowych. Innymi słowy, kowariancja jest miarą siły korelacji między dwiema zmiennymi losowymi.
W innej perspektywie widać, że korelacja jest po prostu znormalizowaną wersją kowariancji, gdzie kowariancja jest podzielona przez iloczyn standardowych odchyleń dwóch zmiennych losowych. Zakres kowariancji może być duży; dlatego porównanie nie jest łatwe. Trudność tę pokonuje się, doprowadzając wartości kowariancji do zakresu, w którym można je porównać poprzez normalizację (coś w rodzaju działania Z-score). Chociaż kowariancja i wariancja są ze sobą powiązane w powyższy sposób, ich rozkłady prawdopodobieństwa nie są ze sobą powiązane w prosty sposób i muszą być traktowane osobno.
Jaka jest różnica między korelacją a kowariancją?
• Zarówno korelacja, jak i kowariancja są miarami relacji między dwiema zmiennymi losowymi. Korelacja jest miarą siły liniowości dwóch zmiennych, a kowariancja jest miarą siły korelacji.
• Wartości współczynników korelacji są wartościami od -1 do +1, natomiast zakres kowariancji nie jest stały, ale może być dodatni lub ujemny. Ale jeśli zmienne losowe są znormalizowane przed obliczeniem kowariancji, wówczas kowariancja jest równa korelacji i ma wartość od -1 do +1.