Varijanca vs kovarijanca
Varijanca i kovarijanca dvije su mjere koje se koriste u statistici. Varijanca je mjera raspršenosti podataka, a kovarijanca označava stupanj promjene dviju slučajnih varijabli zajedno. Varijanca je prilično intuitivan koncept, ali kovarijanca je definirana matematički u početku nije toliko intuitivna.
Više o varijanci
Varijanca je mjera disperzije podataka od srednje vrijednosti distribucije. On govori koliko daleko podatkovne točke leže od srednje vrijednosti distribucije. To je jedan od primarnih deskriptora distribucije vjerojatnosti i jedan od momenata distribucije. Također, varijanca je parametar populacije, a varijanca uzorka iz populacije djeluje kao procjenitelj varijance populacije. Iz jedne perspektive, definira se kao kvadrat standardne devijacije.
U jednostavnom jeziku, može se opisati kao prosjek kvadrata udaljenosti između svake podatkovne točke i srednje vrijednosti distribucije. Za izračun varijance koristi se sljedeća formula.
Var(X)=E[(X-µ)2] za populaciju i
Var(X)=E[(X-‾x)2] za uzorak
Može se dodatno pojednostaviti da se da Var(X)=E[X2]-(E[X])2.
Varijanca ima neka svojstva potpisa i često se koristi u statistici kako bi korištenje bilo jednostavnije. Varijanca je nenegativna jer je kvadrat udaljenosti. Međutim, raspon varijance nije ograničen i ovisi o pojedinoj distribuciji. Varijanca konstantne slučajne varijable je nula, a varijanca se ne mijenja s obzirom na lokacijski parametar.
Više o kovarijanci
U statističkoj teoriji, kovarijanca je mjera koliko se dvije slučajne varijable zajedno mijenjaju. Drugim riječima, kovarijanca je mjera snage korelacije između dviju slučajnih varijabli. Također, može se smatrati generalizacijom koncepta varijance dviju slučajnih varijabli.
Kovarijanca dviju slučajnih varijabli X i Y, koje su zajedno raspoređene s konačnim sekundnim momentom, poznata je kao σXY=E[(X-E[X])(Y-E[Y])]. Iz ovoga se varijanca može promatrati kao poseban slučaj kovarijance, gdje su dvije varijable iste. Cov(X, X)=Var(X)
Normaliziranjem kovarijance može se dobiti linearni koeficijent korelacije ili Pearsonov koeficijent korelacije koji se definira kao ρ=E[(X-E[X])(Y-E[Y])]/(σ X σY)=(Cov(X, Y))/(σX σY )
Grafički, kovarijanca između para podatkovnih točaka može se vidjeti kao površina pravokutnika s podatkovnim točkama na suprotnim vrhovima. Može se tumačiti kao mjera veličine razmaka između dviju podatkovnih točaka. Uzimajući u obzir pravokutnike za cijelu populaciju, preklapanje pravokutnika koji odgovaraju svim podatkovnim točkama može se smatrati snagom odvajanja; varijanca dviju varijabli. Kovarijanca je dvodimenzionalna, zbog dvije varijable, ali njezino pojednostavljenje na jednu varijablu daje varijancu jedne kao razdvajanje u jednoj dimenziji.
Koja je razlika između varijance i kovarijance?
• Varijanca je mjera širenja/raspršenosti u populaciji dok se kovarijanca smatra mjerom varijacije dviju slučajnih varijabli ili jačine korelacije.
• Varijanca se može smatrati posebnim slučajem kovarijance.
• Varijanca i kovarijanca ovise o veličini vrijednosti podataka i ne mogu se uspoređivati; dakle, oni su normalizirani. Kovarijanca se normalizira u koeficijent korelacije (dijeleći s umnoškom standardnih odstupanja dviju slučajnih varijabli), a varijanca se normalizira u standardnu devijaciju (vađenjem kvadratnog korijena)