Populacija u odnosu na standardnu devijaciju uzorka
U statistici se nekoliko indeksa koristi za opisivanje skupa podataka koji odgovaraju njegovoj središnjoj tendenciji, disperziji i asimetriji. Standardna devijacija jedna je od najčešćih mjera disperzije podataka iz središta skupa podataka.
Zbog praktičnih poteškoća, neće biti moguće koristiti podatke iz cijele populacije kada se testira hipoteza. Stoga koristimo vrijednosti podataka iz uzoraka kako bismo donijeli zaključke o populaciji. U takvoj situaciji oni se nazivaju procjenitelji jer procjenjuju vrijednosti parametara populacije.
Izuzetno je važno koristiti nepristrane procjenitelje u zaključivanju. Kaže se da je procjenitelj nepristran ako je očekivana vrijednost tog procjenitelja jednaka parametru populacije. Na primjer, koristimo srednju vrijednost uzorka kao nepristranu procjenu za srednju populaciju. (Matematički se može pokazati da je očekivana vrijednost srednje vrijednosti uzorka jednaka srednjoj vrijednosti populacije). U slučaju procjene standardne devijacije populacije, standardna devijacija uzorka također je nepristran procjenitelj.
Što je standardna devijacija populacije?
Kada se podaci iz cijele populacije mogu uzeti u obzir (na primjer u slučaju popisa), moguće je izračunati standardnu devijaciju stanovništva. Za izračun standardne devijacije populacije prvo se izračunavaju odstupanja vrijednosti podataka od srednje vrijednosti populacije. Korijen srednje kvadratne vrijednosti (kvadratna sredina) odstupanja naziva se standardna devijacija populacije.
U razredu od 10 učenika lako se prikupljaju podaci o učenicima. Ako se hipoteza testira na ovoj populaciji učenika, tada nema potrebe za korištenjem vrijednosti uzorka. Na primjer, izmjerene su težine 10 učenika (u kilogramima) 70, 62, 65, 72, 80, 70, 63, 72, 77 i 79. Tada je srednja težina deset osoba (u kilogramima) (70+62+65+72+80+70+63+72+77+79)/10, što je 71 (u kilogramima). Ovo je prosjek populacije.
Da bismo sada izračunali standardnu devijaciju populacije, izračunavamo odstupanja od srednje vrijednosti. Dotična odstupanja od srednje vrijednosti su (70 – 71)=-1, (62 – 71)=-9, (65 – 71)=-6, (72 – 71)=1, (80 – 71)=9, (70 – 71)=-1, (63 – 71)=-8, (72 – 71)=1, (77 – 71)=6 i (79 – 71)=8. Zbroj kvadrata odstupanja je (-1)2 + (-9)2 + (-6)2 + 1 2 + 92 + (-1)2 + (-8)2+ 12 + 62 + 82 =366. Standardna devijacija populacije je √(366/10)=6,05 (u kilogramima). 71 je točna srednja težina učenika razreda, a 6.05 je točna standardna devijacija težine od 71.
Što je standardna devijacija uzorka?
Kada se podaci iz uzorka (veličine n) koriste za procjenu parametara populacije, izračunava se standardna devijacija uzorka. Prvo se izračunaju odstupanja vrijednosti podataka od srednje vrijednosti uzorka. Budući da se srednja vrijednost uzorka koristi umjesto srednje vrijednosti populacije (koja je nepoznata), uzimanje kvadratne sredine nije prikladno. Kako bi se nadoknadila upotreba srednje vrijednosti uzorka, zbroj kvadrata odstupanja dijeli se s (n-1) umjesto s n. Standardna devijacija uzorka je kvadratni korijen ovoga. U matematičkim simbolima, S=√{∑(xi-ẍ)2 / (n-1)}, gdje je S standardna devijacija uzorka, ẍ je srednja vrijednost uzorka, a xi's su podatkovne točke.
Sada pretpostavimo da su u prethodnom primjeru populacija učenici cijele škole. Tada će razred biti samo uzorak. Ako se ovaj uzorak koristi u procjeni, standardna devijacija uzorka bit će √(366/9)=6.38 (u kilogramima) budući da je 366 podijeljeno s 9 umjesto s 10 (veličina uzorka). Činjenica koju treba primijetiti jest da nije zajamčeno da je to točna vrijednost standardne devijacije populacije. To je samo procjena za to.
Koja je razlika između standardne devijacije populacije i standardne devijacije uzorka?
• Standardna devijacija populacije je točna vrijednost parametra koja se koristi za mjerenje disperzije od centra, dok je standardna devijacija uzorka nepristran procjenitelj za to.
• Standardna devijacija populacije izračunava se kada su poznati svi podaci koji se odnose na svakog pojedinca u populaciji. Inače se izračunava standardna devijacija uzorka.
• Standardna devijacija populacije dana je kao σ=√{ ∑(xi-µ)2/ n} gdje je µ srednja vrijednost populacije, a n veličina populacije, ali standardna devijacija uzorka dana je kao S=√{ ∑(xi-ẍ)2 / (n-1)} gdje je ẍ srednja vrijednost uzorka, a n veličina uzorka.