Úlohou opisnej štatistiky je vytvorenie prehľadu o získaných údajoch, ktoré samé o sebe predstavujú neprehľadnú zmes čísel, prípadne aj písmen. Na tento účel slúžia opisné charakteristiky, tabuľky, grafy a viacrozmerné prieskumné techniky.

www.anti skola.eu

Opisné charakteristiky

Opisná charakteristika predstavuje číslo vypočítané podľa príslušného vzorca zo štatistického súboru. Cieľom opisných charakteristík je charakterizovať súbor.

Opisné charakteristiky sa delia na tri skupiny:

a) Miery polohy

b) Miery variability

c) Miery tvaru



a) Miery polohy (Stredné hodnoty)

Aritmetický priemer (Mean)
Najznámejšou strednou hodnotou je aritmetický priemer, ktorý sa vypočíta ako súčet všetkých hodnôt vydelený ich počtom:

Aritmetický priemer

Geometrický priemer (Geometric Mean)
Geometrický priemer je vhodnejšou mierou polohy ako aritmetický priemer pre pomerovú premennú (špeciálny typ intervalovej premennej s bodom absolútnej nuly, pod ktorú hodnota premennej nemôže klesnúť - napr. hmotnosť, výška, vek) s pozitívnou šikmosťou (napr. rozdelenie príjmov obyvateľstva). Geometrický priemer sa často používa v ekonómii a biológii, keď je premenná skôr súčinom ako súčtom mnohých malých efektov (logaritmus premennej má bližšie k symetrickému normálnemu rozdeleniu ako samotná premenná). Vypočíta sa ako n-tá odmocnina súčinu všetkých hodnôt:

Geometrický priemer

Harmonický priemer (Harmonic Mean)
Harmonický priemer sa používa na výpočet priemernej rýchlosti ak sú vzdialenosti konštantné a čas premenlivý. Priemerná rýchlosť auta, ktoré prešlo vzdialenosť 50 km rýchlosťou 90 km/h a ďalších 50 km rýchlosťou 130 km/h sa rovná podielu celkovej dráhy a času: 100/(50/90+50/130)=106,4 čo je ekvivalentné harmonickému priemeru dvoch rýchlostí: 2/(1/90+1/130)=106,4. V prípade rôznych vzdialeností a rovnakých časov sa však musí použiť aritmetický priemer. Priemerná rýchlosť auta, ktoré išlo 2 hodiny rýchlosťou 90 km/h a ďalšie 2 hodiny 130 km/h sa rovná: (90+130)/2=110 km/h. Do výpočtu harmonického priemeru možno zahrnúť iba nenulové hodnoty:

Harmonický priemer




Medián (Median)
Medián Medián predstavuje strednú hodnotu súboru, ktorý je zoradený od najmeej po najväčšiu hodnotu. V prípade párneho počtu hodnôt je medián aritmetický priemer hodnôt na miestach n/2 a n/2+1. Medián, na rozdiel od priemeru, nie je ovplyvneextrémnymi hodnotami. Medián predstavuje najpoužívanejší kvantil. Kvantil súboru je hodnota k-tej časti, ak je súbor rozdelený na n rovnakých častí (hodnoty sú zoradené od najmeej po najväčšiu). Okrem mediánu sa často používajú kvartily (delia súbor na 4 časti) a percentily (delia súbor na 100 častí). Medián je druhý kvartil, resp. 50. percentil.




Modus (Mode)
Modus Modus predstavuje najčastejšie sa vyskytujúcu hodnotu premennej. Rozdelenie, ktoré má iba jeden vrchol, teda jedno lokálne maximum, ktoré je zároveň globálne, sa nazýva unimodálne. Štatistické programy registrujú jeden alebo žiadny modus.





b) Miery variability

 

Variačné rozpätie (Range)
Najjednoduchšou mierou variability je variačné rozpätie, ktoré sa vypočíta ako rozdiel medzi najväčšou a najmenšou hodnotou súboru:

Variačné rozpätie



Medzikvartilové rozpätie (Interquartile Range)
Predstavuje rozdiel medzi tretím a prvým kvartilom (75. a 25. percentilom), čo reprezentuje oblasť stredných 50 percent hodnôt premennej. Táto miera variability nie je ovplyvneextrémnymi hodnotami premennej.




Rozptyl (Variance)
Najpoužívanejšou mierou variability je rozptyl, ktorý sa rovná priemernému štvorcu odchýlky hodnoty od priemeru. Čím je rozptyl väčší, tým sa údaje viac odchyľujú od priemeru. Rozptyl sa vypočíta podľa vzorca:

Rozptyl




Štandardná odchýlka (Standard Deviation)
Dôsledkom nutného umocňovania je vypočítaná hodnota rozptylu v štvorcoch pôvodných jednotiek. Aby sa odstránil neblahý vplyv umocňovania, rozptyl sa odmocní, čím sa vypočíta štandardná odchýlka:

Štandardná odchýlka

Štandardná odchýlka sa dá interpretovať dvoma spôsobmi. Po prvé je to priemerný rozdiel medzi hodnotami a priemerom pri ignorovaní znamienok. Po druhé je to priemerný rozdiel medzi každými dvoma hodnotami pri ignorovaní znamienok.




Variačný koeficient (Coefficient of Variation)
Variačný koeficient predstavuje relatívnu mieru variability. Používa sa na porovnávanie variability medzi súbormi dát s odlišnými priemermi. Variačný koeficient výšky vzorky ľudí bude rovnaký bez ohľadu na to, či výšku budeme vyjadrovať v centimetroch alebo metroch. Vypočíta sa ako podiel štandardnej odchýlky a priemeru.

Variačný koeficient




Koeficient disperzie (Coefficient of Dispersion)
Koeficient disperzie predstavuje relatívnu mieru variability, ktorá je iba málo ovplyvneextrémnymi hodnotami.

Koeficient disperzie