Odstupanje u odnosu na standardno odstupanje
Odstupanje u odnosu na standardno odstupanje
U deskriptivnoj i inferencijalnoj statistici koristi se nekoliko indeksa za opisivanje skupa podataka koji odgovaraju njegovoj središnjoj tendenciji, disperziji i asimetriji. U statističkom zaključivanju, oni su obično poznati kao procjenitelji budući da procjenjuju vrijednosti parametara populacije.
Disperzija je mjera širenja podataka oko središta skupa podataka. Standardna devijacija jedna je od najčešće korištenih mjera disperzije. Odstupanja svake podatkovne točke od srednje vrijednosti uzimaju se u obzir pri izračunu standardne devijacije. Stoga se može tvrditi da će standardna devijacija zajedno sa srednjom vrijednosti pružiti gotovo dovoljnu sliku o skupu podataka.
Razmotrite sljedeći skup podataka. Izmjerene su težine 10 ljudi (u kilogramima) na 70, 62, 65, 72, 80, 70, 63, 72, 77 i 79. Tada je srednja težina deset ljudi (u kilogramima) 71 (u kilogramima).
Što je devijacija?
U statistici, odstupanje znači iznos za koji se jedna podatkovna točka razlikuje od fiksne vrijednosti kao što je srednja vrijednost. Općenito, neka je k fiksna vrijednost i x1, x2, …, xn označavaju podatak postaviti. Tada je odstupanje xj od k definirano kao (xj– k).
Na primjer, u gornjem skupu podataka odgovarajuća odstupanja od srednje vrijednosti su (70 – 71)=-1, (62 – 71)=-9, (65 – 71)=-6, (72 – 71)=1, (80 – 71)=9, (70 – 71)=-1, (63 – 71)=-8, (72 – 71)=1, (77 – 71)=6 i (79 – 71)=8.
Što je standardna devijacija?
Kada se mogu uzeti u obzir podaci iz cijele populacije (primjerice u slučaju popisa), moguće je izračunati standardnu devijaciju stanovništva. Za izračun standardne devijacije populacije prvo se izračunavaju odstupanja vrijednosti podataka od srednje vrijednosti populacije. Korijen srednje kvadratne vrijednosti (kvadratna sredina) odstupanja naziva se standardna devijacija populacije. U simbolima, σ=√{ ∑(xi-µ)2 / n} gdje je µ srednja vrijednost populacije, a n veličina populacije.
Kada se podaci iz uzorka (veličine n) koriste za procjenu parametara populacije, izračunava se standardna devijacija uzorka. Prvo se izračunaju odstupanja vrijednosti podataka od srednje vrijednosti uzorka. Budući da se srednja vrijednost uzorka koristi umjesto srednje vrijednosti populacije (koja je nepoznata), uzimanje kvadratne sredine nije prikladno. Kako bi se nadoknadila upotreba srednje vrijednosti uzorka, zbroj kvadrata odstupanja dijeli se s (n-1) umjesto s n. Standardna devijacija uzorka je kvadratni korijen ovoga. U matematičkim simbolima, S=√{ ∑(xi-ẍ)2 / (n-1)}, gdje je S standardna devijacija uzorka, ẍ je srednja vrijednost uzorka, a xi su podatkovne točke.
U prethodnom skupu podataka, zbroj kvadrata odstupanja je (-1)2 + (-9)2 + (-6)2 + 12 + 92 + (-1) 2 + (-8)2 + 12 + 62 + 82=366. Dakle, standardna devijacija populacije je √(366/10)=6,05 (u kilogramima). (Pod pretpostavkom da se populacija koja se razmatra sastoji od 10 osoba od kojih su podaci uzeti).
Koja je razlika između devijacije i standardne devijacije?
• Standardna devijacija je statistički indeks i procjenitelj, ali devijacija nije.
• Standardna devijacija je mjera disperzije klastera podataka od središta, dok se odstupanje odnosi na količinu za koju se pojedinačna podatkovna točka razlikuje od fiksne vrijednosti.