Umræða fréttir
Faraldsfræði 27: Réttmæti aðferða(fræði)
Í þessum þriðja pistli um hugtakið réttmæti (validity) verður spjallað almennt um réttmæti aðferða eða aðferðafræði. Áður hefur verið rætt um réttmæti gagna og rannsóknarniðurstaðna. Réttmæti aðferða og mælitækja í faraldsfræðilegum eða tölfræðilegum skilningi tekur til þess hvort ákveðin aðferð eða mælitæki sem notuð er til að safna gögnum eða vinna úr þeim geri í raun það sem til er ætlast, hvort hún mæli það sem á að mæla eða vinni úr gögnunum þær upplýsingar sem vænst var.
Réttmæti mælitækja og úrvinnsluaðferða byggist að mörgu leyti á sömu grundvallarhugtökum og rædd voru varðandi réttmæti rannsóknarniðurstaðna. Þannig þarf að huga að tveimur aðalatriðum: er mælitækið (eða úrvinnsluaðferðin) réttmætt í því þýði sem það var þróað í (innra réttmæti, internal valdity) og er það réttmætt í öðrum þýðum (ytra réttmæti, external validity, generalizability). Eins og áður gildir að innra réttmæti er grundvöllur ytra réttmætis. Ytra réttmæti getur ekki verið til staðar án innra réttmætis, sem þó er ekki nægilegt eitt sér til að tryggja ytra réttmæti.
Þegar rætt er um mælitæki í þessu samhengi er ekki átt við hlutlægar mælingar, svo sem ljósgleypni eða beinþéttni, heldur aðferðir sem beitt er til að mæla viðföng sem ekki lúta sömu hlutlægu lögmálum og eru í sumum tilvikum að einhverju eða verulegu leyti huglæg. Sem dæmi um slík viðföng má nefna viðhorf sjúklinga til tiltekinnar þjónustu eða skilning þeirra á eigin sjúkdómi, þekkingu lækna á ákveðnum sjúkdómi eða upplifun almennings á eigin matarvenjum. Slíkar stærðir eru gjarnan mældar með einhvers konar spurningalistum eða viðtölum. Réttmæti þeirra aðferða snýst þá um það hvort til dæmis spurningalistinn sem lagður er fyrir sjúklinga til að mæla þekkingu þeirra á eigin sjúkdómi geri í raun það sem til er ætlast þannig að niðurstöður hans endurspegli persónulega þekkingu sjúklings á sjúkdómsástandi sínu. Þar sem um mælingu huglægra þátta er að ræða geta fjölmörg atriði orðið til þess að spilla réttmæti slíks mælitækis. Innan þýðisins þar sem mælitækið var þróað getur innra réttmæti takmarkast til dæmis af ónógum fjölda spurninga, óljósu orðalagi eða óviðeigandi spurningum sem ekki duga til að varpa ljósi á mikilvæga þætti. Ef mælitækinu er beitt í öðrum þýðum geta komið fram annmarkar á ytra réttmæti mælitækisins af ýmsum sökum, svo sem vegna breytileika í málfari og málskilningi eða mismunandi viðhorfa til sjúkdóma.
Réttmæti úrvinnsluaðferða veltur að mestu leyti á svipuðum þáttum og réttmæti mælitækja. Á svipaðan hátt og í umræðunni um réttmæti mælitækja er hér átt við úrvinnsluaðferðir sem byggjast á ákveðnum forsendum sem ekki er alltaf unnt að mæla með hlutlægum hætti og ekki eru algildar. Því eru úrvinnsluaðferðirnar heldur ekki algildar, ólíkt viðurkenndum stærðfræðilögmálum, og réttmæti þeirra má draga í efa ef þær eru ekki studdar viðeigandi gögnum og prófunum. Gott dæmi um slíkar úrvinnsluaðferðir eru til dæmis reiknilíkön sem notuð eru til að lýsa eiginleikum þýðis, innra sambandi eiginleika þess eða til að spá fyrir um atburði innan þess. Fjölmörg slík líkön eru í daglegri notkun innan heilbrigðisþjónustunnar, ýmist í klínískum tilgangi eða til stjórnunar og ákvarðanatöku. Má til dæmis nefna APACHE (Acute Physiology and Chronic Health Evaluation) líkanið sem notað er til að spá fyrir um skammtímaafdrif gjörgæslusjúklinga og DRG (Diagnosis-Related Groups) flokkunarkerfið sem nýtt er til að flokka sjúklinga eftir klínískum upplýsingum í þokkalega einsleita hópa hvað rekstrarlegar útkomur varðar. Innra réttmæti slíkra líkana getur takmarkast af ónógri þekkingu á þróunarþýðinu og eiginleikum þess, ófullnægjandi framsetningu forspárþátta, takmarkaðri stærð úrtaks sem leiðir til óstöðugra ályktana og öðrum þáttum sem valda því að aðferðin endurspeglar ekki raunverulega eiginleika þýðisins eða samband áhættuþátta og útkomu innan þess. Ytra sannleiksgildi líkana, eða notagildi þeirra í öðrum þýðum en þar sem þau voru upphaflega þróuð, getur sömuleiðis takmarkast af fjölmörgum þáttum, svo sem breytileika í lýðfræðilegri samsetningu, dreifingu og framgangi sjúkdóma, aðgengi að þjónustu, venjum við rannsóknir og meðferð, og, ef um er að ræða rekstrarfræðileg gögn, breytileika í formi og rekstri heilbrigðisþjónustunnar.
Hér hefur verið stiklað á stóru um þá fjölmörgu þætti er áhrif geta haft á réttmæti faraldsfræðilegra og tölfræðilegra aðferða. Í næsta pistli verður farið nánar út í þá sálma, rætt um aðferðafræðilegar orsakir og tekin fyrir dæmi til að skýra málið frekar.
Réttmæti mælitækja og úrvinnsluaðferða byggist að mörgu leyti á sömu grundvallarhugtökum og rædd voru varðandi réttmæti rannsóknarniðurstaðna. Þannig þarf að huga að tveimur aðalatriðum: er mælitækið (eða úrvinnsluaðferðin) réttmætt í því þýði sem það var þróað í (innra réttmæti, internal valdity) og er það réttmætt í öðrum þýðum (ytra réttmæti, external validity, generalizability). Eins og áður gildir að innra réttmæti er grundvöllur ytra réttmætis. Ytra réttmæti getur ekki verið til staðar án innra réttmætis, sem þó er ekki nægilegt eitt sér til að tryggja ytra réttmæti.
Þegar rætt er um mælitæki í þessu samhengi er ekki átt við hlutlægar mælingar, svo sem ljósgleypni eða beinþéttni, heldur aðferðir sem beitt er til að mæla viðföng sem ekki lúta sömu hlutlægu lögmálum og eru í sumum tilvikum að einhverju eða verulegu leyti huglæg. Sem dæmi um slík viðföng má nefna viðhorf sjúklinga til tiltekinnar þjónustu eða skilning þeirra á eigin sjúkdómi, þekkingu lækna á ákveðnum sjúkdómi eða upplifun almennings á eigin matarvenjum. Slíkar stærðir eru gjarnan mældar með einhvers konar spurningalistum eða viðtölum. Réttmæti þeirra aðferða snýst þá um það hvort til dæmis spurningalistinn sem lagður er fyrir sjúklinga til að mæla þekkingu þeirra á eigin sjúkdómi geri í raun það sem til er ætlast þannig að niðurstöður hans endurspegli persónulega þekkingu sjúklings á sjúkdómsástandi sínu. Þar sem um mælingu huglægra þátta er að ræða geta fjölmörg atriði orðið til þess að spilla réttmæti slíks mælitækis. Innan þýðisins þar sem mælitækið var þróað getur innra réttmæti takmarkast til dæmis af ónógum fjölda spurninga, óljósu orðalagi eða óviðeigandi spurningum sem ekki duga til að varpa ljósi á mikilvæga þætti. Ef mælitækinu er beitt í öðrum þýðum geta komið fram annmarkar á ytra réttmæti mælitækisins af ýmsum sökum, svo sem vegna breytileika í málfari og málskilningi eða mismunandi viðhorfa til sjúkdóma.
Réttmæti úrvinnsluaðferða veltur að mestu leyti á svipuðum þáttum og réttmæti mælitækja. Á svipaðan hátt og í umræðunni um réttmæti mælitækja er hér átt við úrvinnsluaðferðir sem byggjast á ákveðnum forsendum sem ekki er alltaf unnt að mæla með hlutlægum hætti og ekki eru algildar. Því eru úrvinnsluaðferðirnar heldur ekki algildar, ólíkt viðurkenndum stærðfræðilögmálum, og réttmæti þeirra má draga í efa ef þær eru ekki studdar viðeigandi gögnum og prófunum. Gott dæmi um slíkar úrvinnsluaðferðir eru til dæmis reiknilíkön sem notuð eru til að lýsa eiginleikum þýðis, innra sambandi eiginleika þess eða til að spá fyrir um atburði innan þess. Fjölmörg slík líkön eru í daglegri notkun innan heilbrigðisþjónustunnar, ýmist í klínískum tilgangi eða til stjórnunar og ákvarðanatöku. Má til dæmis nefna APACHE (Acute Physiology and Chronic Health Evaluation) líkanið sem notað er til að spá fyrir um skammtímaafdrif gjörgæslusjúklinga og DRG (Diagnosis-Related Groups) flokkunarkerfið sem nýtt er til að flokka sjúklinga eftir klínískum upplýsingum í þokkalega einsleita hópa hvað rekstrarlegar útkomur varðar. Innra réttmæti slíkra líkana getur takmarkast af ónógri þekkingu á þróunarþýðinu og eiginleikum þess, ófullnægjandi framsetningu forspárþátta, takmarkaðri stærð úrtaks sem leiðir til óstöðugra ályktana og öðrum þáttum sem valda því að aðferðin endurspeglar ekki raunverulega eiginleika þýðisins eða samband áhættuþátta og útkomu innan þess. Ytra sannleiksgildi líkana, eða notagildi þeirra í öðrum þýðum en þar sem þau voru upphaflega þróuð, getur sömuleiðis takmarkast af fjölmörgum þáttum, svo sem breytileika í lýðfræðilegri samsetningu, dreifingu og framgangi sjúkdóma, aðgengi að þjónustu, venjum við rannsóknir og meðferð, og, ef um er að ræða rekstrarfræðileg gögn, breytileika í formi og rekstri heilbrigðisþjónustunnar.
Hér hefur verið stiklað á stóru um þá fjölmörgu þætti er áhrif geta haft á réttmæti faraldsfræðilegra og tölfræðilegra aðferða. Í næsta pistli verður farið nánar út í þá sálma, rætt um aðferðafræðilegar orsakir og tekin fyrir dæmi til að skýra málið frekar.