Contact

Daria Pašalić
Editor-in-Chief
Department of Medical Chemistry, Biochemistry and Clinical Chemistry
Zagreb University School of Medicine
Šalata ul 2.
10 000 Zagreb, Croatia
Phone +385 (1) 4590 205; +385 (1) 4566 940
E-mail: dariapasalic [at] gmail [dot] com

Useful links

 Odabrane teme iz biostatistike

 

Mary L. McHugh. Standardna pogreška: značenje i interpretacija. Biochemia Medica 2008;18(1):7-13.

Fakultet sestrinstva, Sveučilište Indianapolisa, Indianapolis, Indiana, SAD

 *Adresa za dopisivanje: Mary [dot] McHugh [at] uchsc [dot] edu

 

Sažetak

Statistika standardne pogreške je vrsta inferencijalne statistike koja donekle funkcionira kao opisna statistika po tome što istraživaču dozvoljava sastavljanje intervala pouzdanosti o dobivenoj statistici uzorka. Tako načinjen interval pouzdanosti pruža procjenu intervala u kojem će se nalaziti populacijski parametar. Dvije statistike standardne pogreške koje su najčešće u uporabi su standardna pogreška srednje vrijednosti i standardna pogreška procjene.

Standardna pogreška srednje vrijednosti istraživaču omogućava sastavljanje intervala pouzdanosti u kojem će se vjerojatno nalaziti srednja vrijednost populacije. Formula (1-P) (najčešće P < 0,05) predstavlja vjerojatnost da će se srednja vrijednost populacije nalaziti u izračunanom intervalu (obično 95%).

Standardna pogreška procjene jest druga statistika standardne pogreške kojom se istraživači najčešće koriste. Ta se statistika primjenjuje s mjerom korelacije, Pearsonovim R, koja istraživaču može omogućiti stvaranje intervala pouzdanosti unutar kojeg će se nalaziti stvarna korelacija populacije. Izračuni dobiveni temeljem R i standardne pogreške procjene mogu se primijeniti da bi odredilo koliko je točna procjena korelacije za populaciju kao statistika korelacije uzorka.

Standardna pogreška je važan pokazatelj koliko statistika uzorka predstavlja točnu procjenu populacijskog parametra. Razmotrena zajedno s takvim mjerama kao što su veličina učinka, vrijednost P te veličina uzorka, veličina učinka može biti korisno pomagalo istraživaču koji želi razumjeti točnost statistike koja se izračunava na slučajnim uzorcima.

Ključne riječi: statistika, standardna pogreška

Pristiglo: 16. listopada 2007.                                                                                                                                Prihvaćeno: 14. studenoga 2007.

Što je standardna pogreška?

Statistika standardne pogreške predstavlja vrstu statističkih podataka koji se u mnogim inferencijalnim statistikama prikazuju kao izlazni podatci, no funkcioniraju kao opisna statistika. Izraz standardna pogreška specifično se odnosi na skupinu statističkih podataka koji pružaju informacije o raspršenju vrijednosti unutar nekog skupa. Kod primjene standardne pogreške pretpostavlja se da je korisnik upoznat sa središnjim graničnim teoremom i pretpostavkama o skupu podataka s kojim istraživač radi.

Središnji granični teorem je temeljna pretpostavka cjelokupne parametarske inferencijalne statistike. Za njegovu je primjenu nužno da uzorak bude slučajan te da su zapažanja o svakom pojedinom ispitaniku neovisna o zapažanjima o bilo kojem drugom ispitaniku. Teorem ustvrđuje da će razdioba uzorkovanja srednjih vrijednosti dobivenih iz velikog broja slučajnih uzoraka uzetih iz ishodišne populacije pokazivati normalnu razdiobu bez obzira na oblik ishodišne populacije (1).

Točnije, premda mali broj uzoraka može stvoriti nenormalnu razdiobu, s povećanjem broja uzoraka (tj. povećanjem n) oblik razdiobe srednjih vrijednosti uzoraka ubrzano će se približavati obliku normalne razdiobe. Druga generalizacija na temelju središnjega graničnog teorema jest da kako raste n, tako se smanjuje varijabilnost srednje vrijednosti uzoraka (2). To je važno jer pojam razdiobe uzoraka tvori teorijsku osnovu za matematiku koja istraživačima omogućava da donose zaključke o populaciji iz uzoraka.

Istraživači obično uzimaju samo jedan uzorak jer im nije moguće mjeriti čitavu populaciju. Za to nemaju ni vremena ni novca. Iz istih razloga istraživači ne mogu uzeti mnogo uzoraka iz populacije koja im je zanimljiva. Za njih je stoga osnovno da mogu odrediti vjerojatnost da mjere njihova uzorka pouzdano predstavljaju cjelokupnu populaciju o kojoj onda mogu izraziti predviđanja. Određivanje reprezentativnosti određenog uzorka temelji se na teorijskoj raspoređenosti uzoraka čije ponašanje opisuje središnji granični teorem. Statistika standardne pogreške predstavlja procjene intervala u kojem je moguće utvrditi parametre populacije, a time i stupanj preciznosti u kojem statistika uzorka predstavlja parametar populacije. Što je standardna pogreška manja, tim je statistika uzorka bliža parametru populacije. Standardna pogreška statistike je stoga standardno odstupanje razdiobe uzorka za tu statistiku (3).

Možemo se zapitati kako se standardna pogreška razlikuje od standardnog odstupanja? Ta se dva pojma čine vrlo sličnima. Oni i jesu sasvim slični, no koriste se različito. Standardno odstupanje je mjera promjenljivosti uzorka. Standardna pogreška je mjera promjenljivosti razdiobe uzorkovanja. Baš kao što je standardno odstupanje mjera raspršenja vrijednosti u uzorku, tako je standardna pogreška mjera raspršenja vrijednosti u razdiobi uzorkovanja. To znači da je ta pogreška mjera raspršenja srednjih vrijednosti uzoraka ukoliko se iz populacije uzelo mnogo različitih uzoraka.

Standardna pogreška srednje vrijednosti

Standardnu pogrešku srednje vrijednosti uzorka predstavlja sljedeća formula:

 

Formula pokazuje da je standardna pogreška jednaka standardnom odstupanju podijeljenom s kvadratnim korijenom iz n. To ujedno ukazuje da što je veličina uzorka veća, to je manja standardna pogreška (pod uvjetom da što je veći djelitelj, to je manji rezultat, a što je manji djelitelj, veći je rezultat). Znak za standardnu pogrešku srednje vrijednosti je M ili, kad je znakove teže upisati, često se prikazuje kao „S.E. srednje vrijednosti“, ili jednostavnije SEM (engl. standard error of the mean).

Standardna pogreška srednje vrijednosti može pružiti grubu procjenu intervala kojem će vjerojatno pripadati srednja vrijednost populacije. SEM treba kao standardnu devijaciju pomnožiti s 1,96 da bi se dobila procjena mjesta gdje se očekuje da će pasti 95% srednjih vrijednosti uzorka populacije u teorijskoj razdiobi uzoraka. Da bi se dobio 95%-tni interval pouzdanosti, SEM treba pomnožiti s 1,96 i rezultat dodati srednjoj vrijednosti uzorka kako bi se dobila gornja granica intervala u koji će pasti parametar populacije. Dobiveni će interval pružiti procjenu raspona vrijednosti kojem će vjerojatno pripadati srednja vrijednost populacije. Zapravo, razina vjerojatnosti odabrana za istraživanje (obično P < 0,05) je procjena vjerojatnosti da će srednja vrijednost biti u tom intervalu. Taj je interval gruba procjena intervala pouzdanosti unutar kojega će vjerojatno biti srednja vrijednost populacije. Precizniji interval pouzdanosti treba izračunati pomoću percentila dobivenih t-razdiobom.

Sljedeća primjena vrijednosti 1,96 ± SEM jest kod određivanja iznosi li srednja vrijednost populacije nula. Ako gore izračunani interval uključuje vrijednost „0“, onda postoji jaka vjerojatnost da je srednja vrijednost populacije nula ili blizu ništice. Razmotrimo, primjerice, istraživača koji istražuje dekubitus u populaciji bolesnika koji su imali otvorenu operaciju srca koja je trajala više od 4 sata. Pretpostavimo da je srednji broj dekubitusa bio 0,02 u uzorku od 500 bolesnika, što znači da je dekubitus nastao u 10 bolesnika. Ako je standardna pogreška srednje vrijednosti 0,011, onda srednji broj dekubitusa u populaciji pada približno između 0,04 i 0,0016. To se tumači na sljedeći način: srednja vrijednost populacije je negdje između nula i 20 dekubitusa. S obzirom da srednja vrijednost populacije može biti ništica, istraživač bi mogao zaključiti da 10-oro bolesnika u kojih se razvio dekubitus spada u izuzetke. To bi, pak, nadalje moglo istraživača dovesti do pitanja je li se dekubitus razvio kao funkcija nekog drugog stanja, a ne kao funkcija podvrgavanja operaciji srca koja je trajala dulje od 4 sata.

Standardna pogreška procjene

Standardna pogreška procjene (S.E.est) je mjera promjenljivosti predviđanja kod regresije. Točnije, ona se računa primjenom sljedeće formule:

 

gdje je Y zbirna vrijednost uzorka, a Y’ je predviđeni rezultat.

Zbog toga je standardna pogreška procjene mjera raspršenja (ili promjenljivosti) predviđenih rezultata kod regresije. Ujedno bismo stoga u dijagramu raspršenja u kojem je S.E. est mali mogli očekivati da vidimo kako je većina zapaženih vrijednosti okupljena prilično blizu crte regresije. Kad je S.E. est velik, možemo očekivati da su mnoge od zapaženih vrijednosti daleko od crte regresije, kao na slikama 1 i 2.

 

 

Slika 1. Niska standardna pogreška procjene – predviđene vrijednosti ordinate su blizu crte regresije

 

 

 

Slika 2. Velika standardna pogreška u procjeni – predviđene vrijednosti ordinate raspršene su širom iznad i ispod crte regresije

 

Ostale standardne pogreške

Svaka inferencijalna statistika ima pridruženu standardnu pogrešku. Premda se uvijek ne prikazuje, standardna pogreška je važan statistički podatak jer pruža informaciju o točnosti statistike (4). Kao što je razmatrano ranije, što je standardna pogreška veća, tim je širi interval pouzdanosti statistike. Interval pouzdanosti može, zapravo, biti tolikog razmjera da je velik kao puni raspon vrijednosti ili čak veći. U tom slučaju statistika daje informaciju o položaju parametra populacije. A to znači da je statistika male točnosti jer ona nije dobra procjena parametra populacije.

Na taj je način standardna pogreška statistike povezana s razinom značajnosti rezultata. Kad je standardna pogreška velika u odnosu na statističke podatke, onda je statistika obično bez značajnosti. Međutim, ako je veličina uzorka vrlo velika, primjerice veličine uzorka su veće od 1000, onda je za skoro svaki statistički podatak izračunan za taj uzorak vjerojatno da će biti statistički značajan. Na primjer, korelacija 0,01 biti će statistički značajna za svaku veličinu uzorka veću od 1500. Međutim, tako mala korelacija nije klinički ili znanstveno značajna. Kada su veličine učinka (mjerene kao statistika korelacije) relativno male no statistički značajne, standardna je pogreška vrijedno pomagalo u određivanju je li ta značajnost posljedica dobrog predviđanja ili je samo rezultat tako velike snage da će bilo kakva statistika biti značajna. Odgovor na pitanje o važnosti rezultata moguće je naći korištenjem standardne pogreške za izračun intervala pouzdanosti za statistički podatak. Ako je nalaz statistički značajan, no standardna pogreška stvara tako veliki interval pouzdanosti da on uključuje preko 50% raspona vrijednosti u skupu podataka, onda bi istraživač trebao zaključiti da je nalaz klinički beznačajan (ili nevažan). Takav je zaključak istinit jer raspon vrijednosti u koju spada parametar populacije tako velik da istraživač jedva da ima išta bolju predodžbu o tome gdje zaista spada parametar populacije, nego što je imao prije provedbe istraživanja.

Kada izračunani statistički podatak uključuje dvije ili više varijabli (kao što su regresija, t-test), postoji još jedan statistički podatak koji se može uporabiti za određivanje važnosti nalaza. Taj je statistički podatak veličina učinka povezanosti koja se statistikom ispituje. Razmotrimo, primjerice, regresiju. Pretpostavimo da je veličina uzorka 1500, a značajnost regresije 0,001. Dobivena razina P je vrlo značajna. Međutim, preostaje pitanje koliko su točna i pouzdana predviđanja koja se temelje na regresiji? Veličina učinka daje odgovor na to pitanje. Kod regresije, statistički podatak o veličini učinka je Pearsonov Product Moment koeficijent korelacije (što je puni i točan naziv za Pearsonovu R-korelaciju, često jednostavno navedenu kao R). Ako je Pearsonova vrijednost R ispod 0,30, onda je odnos slab bez obzira na to koliko je značajan rezultat. Vrijednost R od 0,30 znači da je neovisna varijabla uzrokom samo 9% varijance u ovisnoj varijabli. 9%-tna vrijednost je statistički podatak koji se naziva koeficijent determinacije, a računa se kvadriranjem Pearsonovog R. To je još vrijedniji statistički podatak od Pearsona jer je mjera preklapanja ili povezanosti između neovisnih i ovisnih varijabli (v. Sliku 3).

 

 

Slika 3. Koeficijent determinacije

 

Značajna vrijednost koeficijenta determinacije jest da primjenom Pearsonovog R statističkog podatka i standardne pogreške procjene istraživač može načiniti točnu procjenu intervala u kojem će se nalaziti stvarna korelacija populacije. Ta je mogućnost ostvariva za sve parametarske korelacijske statistike i povezane statistike standardne pogreške. U stvari, čak se i kod neparametarskih koeficijenata korelacije (tj. statistike veličine učinka) može načiniti gruba procjena intervala u koji će pripasti veličina učinka populacije pomoću iste vrste izračuna.

Međutim, mnoge statistike dobivene pomoću računalnog statističkog paketa (kao SAS, STATA ili SPSS) ne daju automatski i statistički podatak o veličini učinka. U većini slučajeva statistički podatak o veličini učinka moguće je dobiti dodatnom naredbom. Primjerice, statistika za veličinu učinka kod ANOVA je ETA-square. Naredba SPSS ANOVA automatski ne daje podatke o statistici Eta-square, no istraživač može Eta-square dobiti kao alternativan test na izborniku ANOVA. Kod nekih statistika, međutim, takav povezani statistički podatak o veličini učinka nije dostupan. Kad statistika o veličini učinka nije dostupna, onda je statistika standardne pogreške za statistički test koji se provodi korisna alternativa u određivanju koliko je statistika točna, te stoga i koliko je precizno predviđanje zavisne na temelju nezavisne varijable.

 

Sažetak i zaključci

Standardna pogreška je mjera raspršenja slična standardnom odstupanju. Dok, međutim, standardno odstupanje pruža informaciju o raspršenju vrijednosti uzorka, standardna pogreška daje informaciju o raspršenju vrijednosti u razdiobi uzorkovanja povezanoj s populacijom od interesa iz koje je uzet uzorak. Statistika standardne pogreške mjeri koliko je uzorak točan ili pouzdan kao procjena parametra populacije. Osobito je važno koristiti standardnu pogrešku za procjenu intervala parametra populacije kada statistički podatak o veličini učinka nije dostupan.

Standardna pogreška nije samo mjera raspršenja i točnosti statistike uzorka. Ona je također važan pokazatelj koliko je statistika uzorka pouzdana procjena parametra populacije. Razmatrajući zajedno takve mjere kao što su veličina učinka, vrijednost P te veličina uzorka, veličina učinka može biti vrlo korisno sredstvo istraživaču koji nastoji razumjeti pouzdanost i točnost statistike izračunane za slučajne uzorke.

 

Literatura

1.    Glass GV, Hopkins KD. (1996). Statistical Methods in Education and Psychology. 3rd ed. Needham Heights, Massachusetts: Allyn and Bacon, 1996.

2.    Larsen RJ, Marx ML. An Introduction to Mathematical Statistics and Its Applications. 4th ed. Upper Saddle River, New Jersey: Pearson-Prentice Hall, 2006.

3.    Standard error. Lane DM. HyperStat Online. Available at: http://damidmlane.com/hyperstat/A103397.html. Accessed September 10, 2007.

4.    Standard error. Allison PD. Available at: http://www.scc.upenn.edu/čAllison4.html. Accessed: October 3, 2007