Slučajne varijable u odnosu na distribuciju vjerojatnosti
Statistički eksperimenti su nasumični eksperimenti koji se mogu beskonačno ponavljati s poznatim skupom ishoda. S takvim eksperimentima povezane su i slučajne varijable i distribucije vjerojatnosti. Za svaku slučajnu varijablu postoji pridružena distribucija vjerojatnosti definirana funkcijom koja se naziva funkcija kumulativne distribucije.
Što je slučajna varijabla?
Slučajna varijabla je funkcija koja dodjeljuje numeričke vrijednosti ishodima statističkog eksperimenta. Drugim riječima, to je funkcija definirana iz prostora uzorka statističkog eksperimenta u skup realnih brojeva.
Na primjer, razmotrite slučajni eksperiment dvaput bacanja novčića. Mogući ishodi su HH, HT, TH i TT (H – glave, T – priče). Neka je varijabla X broj promatranih glava u pokusu. Zatim, X može poprimiti vrijednosti 0, 1 ili 2, te je slučajna varijabla. Ovdje će slučajna varijabla X preslikati skup S={HH, HT, TH, TT} (prostor uzorka) u skup {0, 1, 2} na takav način da se HH preslika u 2, HT i TH preslikavaju se u 1, a TT se preslikava u 0. U zapisu funkcije, to se može napisati kao, X: S → R gdje je X(HH)=2, X(HT)=1, X(TH)=1 i X(TT)=0.
Postoje dvije vrste slučajnih varijabli: diskretne i kontinuirane, prema tome broj mogućih vrijednosti koje slučajna varijabla može preuzeti je li najviše prebrojiv ili ne. U prethodnom primjeru, slučajna varijabla X je diskretna slučajna varijabla budući da je {0, 1, 2} konačan skup. Sada razmotrite statistički eksperiment pronalaženja težine učenika u razredu. Neka je Y slučajna varijabla definirana kao težina učenika. Y može uzeti bilo koju realnu vrijednost unutar određenog intervala. Dakle, Y je kontinuirana slučajna varijabla.
Što je distribucija vjerojatnosti?
Distribucija vjerojatnosti je funkcija koja opisuje vjerojatnost da slučajna varijabla poprimi određene vrijednosti.
Funkcija koja se naziva funkcija kumulativne distribucije (F) može se definirati iz skupa realnih brojeva u skup realnih brojeva kao F(x)=P(X ≤ x) (vjerojatnost da X bude manji od ili jednako x) za svaki mogući ishod x. Sada se funkcija kumulativne distribucije X u prvom primjeru može napisati kao F(a)=0, ako je a<0; F(a)=0,25, ako je 0≤a<1; F(a)=0,75, ako je 1≤a<2 i F(a)=1, ako je a≥2.
U slučaju diskretnih slučajnih varijabli, funkcija se može definirati iz skupa mogućih ishoda u skup realnih brojeva na takav način da je ƒ(x)=P(X=x) (vjerojatnost X koji je jednak x) za svaki mogući ishod x. Ova određena funkcija ƒ naziva se funkcija mase vjerojatnosti slučajne varijable X. Sada se funkcija mase vjerojatnosti X u prvom konkretnom primjeru može napisati kao ƒ(0)=0,25, ƒ(1)=0,5, ƒ(2)=0,25, i ƒ(x)=0 inače. Stoga će funkcija mase vjerojatnosti zajedno s funkcijom kumulativne distribucije opisati distribuciju vjerojatnosti X u prvom primjeru.
U slučaju kontinuiranih slučajnih varijabli, funkcija koja se naziva funkcija gustoće vjerojatnosti (ƒ) može se definirati kao ƒ(x)=dF(x)/dx za svaki x gdje je F funkcija kumulativne distribucije kontinuirana slučajna varijabla. Lako je vidjeti da ova funkcija zadovoljava ∫ƒ(x)dx=1. Funkcija gustoće vjerojatnosti zajedno s funkcijom kumulativne distribucije opisuje distribuciju vjerojatnosti kontinuirane slučajne varijable. Na primjer, normalna distribucija (koja je kontinuirana distribucija vjerojatnosti) opisana je pomoću funkcije gustoće vjerojatnosti ƒ(x)=1/√(2πσ2) e^([(x- µ)]2/(2σ2)).
Koja je razlika između slučajnih varijabli i distribucije vjerojatnosti?
• Slučajna varijabla je funkcija koja pridružuje vrijednosti prostora uzorka realnom broju.
• Distribucija vjerojatnosti je funkcija koja pridružuje vrijednosti koje slučajna varijabla može uzeti odgovarajućoj vjerojatnosti pojavljivanja.