Wariancja vs kowariancja
Wariancja i kowariancja to dwie miary stosowane w statystyce. Wariancja jest miarą rozproszenia danych, a kowariancja wskazuje stopień zmiany dwóch zmiennych losowych razem. Wariancja jest raczej intuicyjną koncepcją, ale kowariancja jest definiowana matematycznie w początkowo nie tak intuicyjnie.
Więcej o wariancji
Wariancja jest miarą dyspersji danych od średniej wartości rozkładu. Informuje o odległości punktów danych od średniej rozkładu. Jest to jeden z głównych deskryptorów rozkładu prawdopodobieństwa i jeden z momentów rozkładu. Również wariancja jest parametrem populacji, a wariancja próbki z populacji działa jako estymator wariancji populacji. Z jednej perspektywy jest on definiowany jako kwadrat odchylenia standardowego.
Mówiąc wprost, można to opisać jako średnią kwadratów odległości między każdym punktem danych a średnią rozkładu. Poniższy wzór służy do obliczenia wariancji.
Var (X) = E [(X-µ)2) ] dla populacji, oraz
Var (X) = E [(X-‾x)2) ] na próbkę
Można dodatkowo uprościć, aby podać Var (X) = E [X2) ]-(DAWNY])2).
Wariancja ma pewne właściwości podpisu i często jest używana w statystykach, aby uprościć użycie. Wariancja jest nieujemna, ponieważ jest kwadratem odległości. Jednak zakres wariancji nie jest ograniczony i zależy od konkretnego rozkładu. Wariancja stałej zmiennej losowej wynosi zero, a wariancja nie zmienia się w odniesieniu do parametru lokalizacji.
Więcej informacji o kowariancji
W teorii statystycznej kowariancja jest miarą zmiany dwóch zmiennych losowych. Innymi słowy, kowariancja jest miarą siły korelacji między dwiema zmiennymi losowymi. Można to również uznać za uogólnienie pojęcia wariancji dwóch zmiennych losowych.
Kowariancja dwóch zmiennych losowych X i Y, które są wspólnie rozmieszczone ze skończonym drugim pędem, jest znana jako σXY= E [(X-E [X]) (Y-E [Y])]. Na tej podstawie wariancję można postrzegać jako szczególny przypadek kowariancji, w którym dwie zmienne są takie same. Cov (X, X) = Var (X)
Normalizując kowariancję, można uzyskać współczynnik korelacji liniowej lub współczynnik korelacji Pearsona, który jest zdefiniowany jako ρ = E [(X-E [X]) (Y-E [Y])] / (σX σY ) = (Cov (X, Y)) / (σX σY)
Graficznie kowariancję między parą punktów danych można postrzegać jako obszar prostokąta z punktami danych na przeciwnych wierzchołkach. Można to interpretować jako miarę wielkości separacji między dwoma punktami danych. Biorąc pod uwagę prostokąty dla całej populacji, nakładanie się prostokątów odpowiadających wszystkim punktom danych można uznać za siłę rozdziału; wariancja dwóch zmiennych. Kowariancja występuje w dwóch wymiarach, ze względu na dwie zmienne, ale uproszczenie jej do jednej zmiennej daje wariancję pojedynczej jako separacji w jednym wymiarze.
Jaka jest różnica między wariancją a kowariancją?
• Wariancja jest miarą rozprzestrzeniania się / dyspersji w populacji, podczas gdy kowariancja jest uważana za miarę zmienności dwóch zmiennych losowych lub siły korelacji.
• Wariancję można uznać za szczególny przypadek kowariancji.
• Wariancja i kowariancja zależą od wielkości wartości danych i nie można ich porównywać; dlatego są znormalizowane. Kowariancja jest znormalizowana do współczynnika korelacji (podzielona przez iloczyn odchyleń standardowych dwóch zmiennych losowych), a wariancja jest znormalizowana do odchylenia standardowego (poprzez pierwiastek kwadratowy)