02. tbl. 111. árg. 2025
Umræða og fréttir
Hvaða afl er þér efst í huga?
Umræða um vatnsafl og yfirvofandi orkuskort fer hátt þessa dagana. Ég verð þó að viðurkenna að annars konar afl er mér ofar í huga, jú tölfræðilegt afl tilrauna. Að hámarka það afl hefur fjölmarga kosti, eins og að draga úr fjölda þátttakenda sem þarf, lækka kostnað og auka líkur á að greina raunveruleg tengsl milli breyta. Þegar afl rannsóknar er ekki nægjanlegt, eykst hættan á villu af gerð II, sem þýðir að við greinum ekki tengsl milli breyta, jafnvel þótt þau séu raunverulega til staðar. Þetta skiptir sérstaklega miklu máli í litlum rannsóknum, þar sem skortur á afli getur haft alvarleg áhrif á niðurstöður.
Ein óþarflega algeng mistök eru ónákvæm skráning mælinga. Þegar breytur sem mældar eru á tölulegum skala eru skráðar sem flokkabreytur, dregur það úr afli greiningarinnar, því hluti af upplýsingum gagnanna tapast. Afleiðingin verður sú að færri tengsl greinast sem marktæk og þörf verður á stærri úrtökum til að geta dregið sambærilegar ályktanir.
Til að varpa ljósi á þetta notaði ég gögn úr NHANES-rannsókninni til að kanna samband milli svefnvandamála og líkamsþyngdarstuðuls (BMI). Ég beitti tveimur aðferðum til að greina gögnin: annars vegar t-prófi til að bera saman meðal-BMI þeirra sem greindu frá svefnvandamálum og þeirra sem ekki gerðu það, og hins vegar kí-kvaðratprófi til að bera saman hlutfall svefnvandamála eftir flokkuðum BMI-gildum. Flokkarnir voru skilgreindir samkvæmt viðmiðum WHO: undirþyngd (12,0–18,4), eðlileg þyngd (18,5–24,9), yfirþyngd (25,0–29,9) og offita (30+).
Ég hermdi þúsund sinnum úrtök af mismunandi stærðum, frá 1000 upp í 3500 þátttakendur, og mat líkurnar á því að hægt verði að draga ályktanir um tengsl (p<0,05) miðað við hvað úrtakið er stórt. Niðurstöðurnar voru afgerandi: þegar BMI var greint sem talnabreyta með t-prófi fengust marktæk tengsl í mun fleiri tilraunum en þegar BMI var flokkað og borið saman með kí-kvaðrat prófi. Á grafinu sést að það þarf meira en tvöfalt stærra úrtak til að ná 80% afli með BMI sem flokkabreytu en með BMI sem talnabreytu.
Það sem gerir t-prófið öflugra en -kí-kvaðratpróf er að það nýtir allar upplýsingar í gögnunum. Þegar gögn eru flokkuð tapast mikilvægur breytileiki innan hvers hóps, sem dregur úr næmi greiningarinnar. Þetta á einnig við um flóknari tölfræðiaðferðir, eins og línulega, lógistíska og Cox-aðhvarfsgreiningu. Þar er meginreglan sú að við missum afl til að finna tengsl við svarbreytur sem eru mældar á tölulegum kvarða ef við skiptum þeim upp í flokka. Þó getur flokkun verið gagnleg þegar samband milli breyta er ólínulegt eða þegar flokkarnir endurspegla mikilvæga og merkingarbæra eiginleika.
Ef það er eitthvert afl sem við öll getum sameinast um að hámarka, þá er það tölfræðilegt afl. Það krefst hvorki þess að raska náttúrunni né stórfelldra fjárfestinga, bara vandaðra vinnubragða og viljans til að nýta gögnin sem best.
Mynd 1. Samband fjölda þáttakenda og líkunum á því að geta ályktað um marktæk tengsl (p<0,05). Efri línan sýnir niðurstöður þegar BMI er notuð sem talnabreyta og tengsl við svefnvandamál metin með t-prófi. Sú neðri sýnir þegar BMI er skipt upp í fjóra flokka og tengsl við svefnvandamál metin með kí-kvaðratprófi.