Mean vs Median vs Mode
Prosjek, medijan i mod su primarne mjere središnje tendencije koje se koriste u deskriptivnoj statistici. Oni su potpuno različiti jedni od drugih i različiti su slučajevi u kojima se koriste za sažimanje podataka.
Mean
Aritmetička sredina je zbroj vrijednosti podataka podijeljen s brojem vrijednosti podataka, tj.
[lateks]\bar{x}=\frac{1}{n}\sum_{i=1}^{n}x_{i}=\frac{x_{1}+x_{2} +x_{3}+…+x_{n}}{n}[/latex]
Ako su podaci iz prostora uzorka, naziva se srednja vrijednost uzorka ([latex]\bar{x} [/latex]), što je deskriptivna statistika uzorka. Iako je to najčešće korištena deskriptivna mjera za uzorak, nije robusna statistika. Vrlo je osjetljiv na izvanredne vrijednosti i oscilacije.
Na primjer, uzmite u obzir prosječni prihod građana određenog grada. Budući da se sve vrijednosti podataka zbrajaju i potom dijele, prihod izuzetno bogate osobe značajno utječe na srednju vrijednost. Stoga srednje vrijednosti nisu uvijek dobar prikaz podataka.
Također, u slučaju izmjeničnog signala, struja koja prolazi kroz element povremeno varira od pozitivnog smjera do negativnog smjera i obrnuto. Ako uzmemo prosječnu struju koja prolazi kroz element u jednom periodu, to će dati 0, što znači da struja nije prošla kroz element, što očito nije točno. Stoga ni u ovom slučaju aritmetička sredina nije dobra mjera.
Aritmetička sredina je dobar pokazatelj kada su podaci ravnomjerno raspoređeni. Za normalnu distribuciju, srednja vrijednost je jednaka modi i medijanu. Također ima najniže ostatke kada se uzme u obzir korijen srednje kvadratne pogreške; dakle, najbolja deskriptivna mjera kada je potrebno predstaviti skup podataka jednim brojem.
Medijan
Vrijednosti srednje točke podataka nakon sređivanja svih vrijednosti podataka uzlaznim redoslijedom definiraju se kao medijan skupa podataka. Medijan je 2. kvartil, 5. decil i 50. percentil.
• Ako je broj opažanja (podatkovnih točaka) neparan, tada je medijan opažanje točno na sredini poredanog popisa.
• Ako je broj opažanja (podatkovnih točaka) paran, tada je medijan srednja vrijednost dva srednja opažanja na poredanom popisu.
Medijan dijeli opažanje u dvije grupe; tj. skupina (50%) vrijednosti viših i skupina (50%) vrijednosti nižih od medijana. Medijani se posebno koriste u iskrivljenim distribucijama i predstavljaju podatke prilično bolje od aritmetičke sredine.
Mode
Mode je broj koji se najčešće pojavljuje u skupu opažanja. Način skupa podataka izračunava se pronalaženjem učestalosti svakog elementa unutar skupa.
• Ako se nijedna vrijednost ne pojavi više od jednom, tada skup podataka nema način rada.
• Inače, svaka vrijednost koja se javlja s najvećom učestalošću je način skupa podataka.
U skupu može postojati više od 1 načina; stoga mod nije jedinstvena statistika skupa podataka. U uniformnoj raspodjeli postoji jedan mod. Način diskretne distribucije vjerojatnosti je točka u kojoj funkcija mase vjerojatnosti doseže svoju najvišu točku. Na temelju gornjih interpretacija, možemo reći da su globalni maksimumi načini.
Razmotrite primjenu sve tri mjere na sljedeći skup podataka.
PODACI: {1, 1, 2, 3, 5, 5, 5, 5, 6, 6, 8, 8, 9, 9, 9, 9, 9, 10, 10, 10, 14, 14, 15, 15, 15}
Prosjek=(1+ 1+ 2+ 3+ 5+ 5+ 5+ 5+ 6+ 6+ 8+ 8+ 9+ 9+ 9+ 9+ 10+ 10+ 10+ 14+ 14+ 15+ 15+ 15) / 25=8,12
Medijan=9 (13. element)
Način=9 (frekvencija od 9=5)
Koja je razlika između srednje vrijednosti, medijana i moda?
• Aritmetička sredina je zbroj vrijednosti (opažanja) podijeljen s brojem opažanja. To nije robusna statistika i uvelike ovisi o prirodi normalne distribucije unutar razmatrane distribucije. Jedan outlier može uzrokovati značajan pomak u srednjoj vrijednosti dajući relativno pogrešne vrijednosti. Koncept se može proširiti na geometrijsku sredinu, harmonijsku sredinu, ponderiranu sredinu i tako dalje.
• Medijan je srednje vrijednosti skupa opažanja i na njega relativno manje utječu odstupanja. Može dati dobru procjenu kao sumarnu statistiku u vrlo iskrivljenim slučajevima.
• Način je najčešće vrijednosti opažanja u skupu podataka. Ako je distribucija pozitivno iskrivljena, mod leži lijevo od medijana, a ako je negativno iskrivljena, mod leži desno od medijana.
• Ako je pozitivno iskrivljena, srednja vrijednost je točno do medijana; ako je negativno iskrivljena sredina lijevo od medijana.
• U normalnoj distribuciji, sva tri, srednja vrijednost, mod i medijan su jednaki.