Varijanca u odnosu na standardnu devijaciju
Varijacija je uobičajena pojava u proučavanju statistike jer da nije bilo varijacije u podacima, vjerojatno nam statistika uopće ne bi trebala. Varijacija se u statistici opisuje kao varijanca koja je mjera udaljenosti vrijednosti od njihove srednje vrijednosti. Varijanca je mala ili mala ako su vrijednosti grupirane bliže sredini. Standardna devijacija je još jedna mjera za opisivanje razlike između očekivanih rezultata i njihovih stvarnih vrijednosti. Iako su oboje usko povezani, postoje razlike između varijance i standardne devijacije o kojima će se raspravljati u ovom članku.
Sirove vrijednosti su besmislene u bilo kojoj distribuciji i iz njih ne možemo oduzeti nikakve značajne informacije. Uz pomoć standardne devijacije možemo procijeniti značaj vrijednosti jer nam ona govori koliko smo daleko od srednje vrijednosti. Varijanca je po konceptu slična standardnoj devijaciji osim što je kvadratna vrijednost SD-a. Ima smisla razumjeti koncepte varijance i standardne devijacije uz pomoć primjera.
Pretpostavimo da postoji farmer koji uzgaja bundeve. Ima deset bundeva različitih težina koje su sljedeće.
2.6, 2.6, 2.8, 3.0, 3.1, 3.2, 3.3, 3.5, 3.6, 3.8. Lako je izračunati prosječnu težinu bundeva jer je to zbroj svih vrijednosti podijeljen s 10. U ovom slučaju to je 3,15 funti. Međutim, niti jedna od bundeva nije toliko teška i variraju u težini u rasponu od 0,55 funti lakših do 0,65 funti težih od prosjeka. Sada možemo zapisati razliku svake vrijednosti od srednje vrijednosti na sljedeći način
-0,55, -0,55, -0,35, -0,15, -0,05, 0,15, 0,35, 0,45, 0,65.
Što zaključiti s ovim razlikama u odnosu na srednju vrijednost., Ako pokušamo pronaći prosječnu razliku, vidimo da ne možemo pronaći srednju vrijednost jer su nakon zbrajanja negativne vrijednosti jednake pozitivnim vrijednostima i prosječna razlika se ne može izračunati na taj način. Zbog toga je odlučeno kvadrirati sve vrijednosti prije zbrajanja i pronalaženja srednje vrijednosti. U ovom slučaju, kvadratne vrijednosti dolaze kako slijedi
0.3025, 0.3025, 0.1225, 0.0225, 0.0025, 0.0025, 0.1225, 0.2025, 0.4225.
Sada se ove vrijednosti mogu zbrojiti i podijeliti s deset kako bi se dobila vrijednost koja je poznata kao varijanca. Ova varijanca je 0,1525 funti u ovom primjeru. Ova vrijednost nema veliki značaj jer smo kvadrirali razliku prije nego što smo pronašli njihovu srednju vrijednost. Zbog toga moramo pronaći kvadratni korijen varijance da bismo došli do standardne devijacije. U ovom slučaju to je 0,3905 funti.
Ukratko:
• I varijanca i standardna devijacija mjere su širenja vrijednosti u svim podacima.
• Varijanca se izračunava uzimanjem srednje vrijednosti kvadrata pojedinačnih razlika iz srednje vrijednosti uzorka
• Standardna devijacija je kvadratni korijen varijance.