Umræða fréttir
Faraldsfræði 17: Fylgni
Hugtakið fylgni (correlation) er mikið notað í faraldsfræðilegum rannsóknum. Hugtakið er í sjálfu sér einfalt og gagnlegt en er stundum ofnotað og jafn-vel misnotað.
Almennt er talað um fylgni þegar tvær eða fleiri breytur fylgjast að, þannig að ef breyta A kemur fyrir er líklegt að breyta B komi einnig fyrir. Til dæmis má segja að fylgni sé milli svarts háralitar og brúns augnlitar því almennt er líklegra eða algengara að brúnn augnlitur komi fyrir hjá svarthærðum en til dæmis blár eða grænn augnlitur. Þarna er í raun átt við tengsl (association) en ekki endilega fylgni. Að tengsl séu milli tveggja breyta vísar aðeins til þess að þær komi fyrir saman oftar en svo að tilviljun ein geti ráðið því. Slík tengsl segja ekkert um það hvers konar samband er um að ræða. Í tölfræðilegum skilningi er fylgni skilgreind á talsvert nákvæmari hátt og vísar þá til línulegs sambands milli tveggja samfelldra breyta (continuous variables), það er að segja að breyting á A hafi í för með sér ákveðna, línulega breytingu á B. Samfelldar breytur eru þær sem byggjast á mælingum á hlutfallskvarða (ratio scale). Dæmi um slíkar breytur eru til dæmis hæð, þyngd og blóðþrýstingur. Mælingar á hlutfallskvarða hafa þrjá grundvallareiginleika. Í fyrsta lagi er miðað við skilgreindan núllpunkt. Í öðru lagi eru notaðar einingar sem koma fyrir með jöfnu millibili (það er jafn mikill munur á 3 og 4 eins og á 1280 og 1281, það er ein eining). Í þriðja lagi eru hægt að skilgreina jöfn hlutföll á milli mjög misstórra eininga (3/4 er sama stærð og 750/ 1000). Með línulegu sambandi er átt við að skilgreind breyting á stærð einnar breytu tengist skilgreindri (en ekki endilega jafnstórri) breytingu á stærð annarrar breytu. Til að lýsa styrk slíks sambands er notaður fylgnistuðull (correlation coefficient) sem reiknaður er út frá svokölluðu fylgnilíkani (correlation model). Slíkur stuðull og þær tölfræðilegu aðferðir sem honum tengjast byggjast algerlega á því að um samfelldar breytur sé að ræða. Fylgnistuðull á því ekki við þegar um annars konar breytur er að ræða, svo sem breytur er byggjast á mælingum á kvörðum öðrum en hlutfallskvarða. Dæmi um slíkar breytur eru til dæmis hára- og augnlitur, hjúskaparstaða, menntunarstig, blóðflokkur, hvort ákveðinn sjúkdómur eða einkenni er til staðar eða ekki, og svo framvegis.
Fylgnistuðull getur verið á bilinu -1 til 1. Gildið -1 sýnir að um fullkomna neikvæða fylgni er að ræða (aukning á A hefur í för með sér línulega minnkun á B), gildið 1 endurspeglar fullkomna jákvæða fylgni (aukning á A hefur í för með sér línulega aukningu á B) og gildið 0 sýnir að ekki er fylgni milli A og B.
Rétt er að taka fram að fylgnistuðull lýsir ekki umfangi línulegrar breytingar á einni breytu með tilliti til annarrar. Ef reiknaður er til dæmis fylgnistuðull milli líkamsþyngdar og hæðar þá segir hann ekki til um hve mikillar þyngdaraukningar má að meðaltali vænta fyrir skilgreinda aukningu á hæð. Til þess eru notaðar aðrar aðferðir, til dæmis línuleg aðhvarfsgreining.
En hvaða aðferðir má þá nota til að meta tengsl breyta sem byggjast ekki á hlutfallskvarða og þar sem fylgnistuðull á því ekki við? Til eru ýmsar aðferðir til að meta slík tengsl og við val á heppilegustu nálguninni er nauðsynlegt að hafa í huga kvarðann sem breyturnar byggjast á og nákvæma skilgreiningu á rannsóknarspurningunni sem liggur fyrir. Ef við viljum vita hvort tveir rannsakendur túlka niðurstöður á sama hátt þegar þær eru lagðar fyrir þá hvorn í sínu lagi og þeir beðnir að gefa ákveðið skor, þá má reikna samræmishlutfall á milli þeirra (kappa) og jafnvel taka tillit til þess hve miklar líkur eru á að þeir gefi sama skor af tilviljun einni saman (vegið kappa). Ef kanna á hvort samhengi er milli tekna og þess að búa í ákveðnum borgarhluta má hins vegar nota kí-kvaðrat próf um sjálfstæði þessara tveggja breyta (test of independence). Slíkt próf byggir á kí-kvaðrat dreifingu og hentar því þegar um er að ræða breytur sem fylgja þeirri dreifingu.
Almennt er talað um fylgni þegar tvær eða fleiri breytur fylgjast að, þannig að ef breyta A kemur fyrir er líklegt að breyta B komi einnig fyrir. Til dæmis má segja að fylgni sé milli svarts háralitar og brúns augnlitar því almennt er líklegra eða algengara að brúnn augnlitur komi fyrir hjá svarthærðum en til dæmis blár eða grænn augnlitur. Þarna er í raun átt við tengsl (association) en ekki endilega fylgni. Að tengsl séu milli tveggja breyta vísar aðeins til þess að þær komi fyrir saman oftar en svo að tilviljun ein geti ráðið því. Slík tengsl segja ekkert um það hvers konar samband er um að ræða. Í tölfræðilegum skilningi er fylgni skilgreind á talsvert nákvæmari hátt og vísar þá til línulegs sambands milli tveggja samfelldra breyta (continuous variables), það er að segja að breyting á A hafi í för með sér ákveðna, línulega breytingu á B. Samfelldar breytur eru þær sem byggjast á mælingum á hlutfallskvarða (ratio scale). Dæmi um slíkar breytur eru til dæmis hæð, þyngd og blóðþrýstingur. Mælingar á hlutfallskvarða hafa þrjá grundvallareiginleika. Í fyrsta lagi er miðað við skilgreindan núllpunkt. Í öðru lagi eru notaðar einingar sem koma fyrir með jöfnu millibili (það er jafn mikill munur á 3 og 4 eins og á 1280 og 1281, það er ein eining). Í þriðja lagi eru hægt að skilgreina jöfn hlutföll á milli mjög misstórra eininga (3/4 er sama stærð og 750/ 1000). Með línulegu sambandi er átt við að skilgreind breyting á stærð einnar breytu tengist skilgreindri (en ekki endilega jafnstórri) breytingu á stærð annarrar breytu. Til að lýsa styrk slíks sambands er notaður fylgnistuðull (correlation coefficient) sem reiknaður er út frá svokölluðu fylgnilíkani (correlation model). Slíkur stuðull og þær tölfræðilegu aðferðir sem honum tengjast byggjast algerlega á því að um samfelldar breytur sé að ræða. Fylgnistuðull á því ekki við þegar um annars konar breytur er að ræða, svo sem breytur er byggjast á mælingum á kvörðum öðrum en hlutfallskvarða. Dæmi um slíkar breytur eru til dæmis hára- og augnlitur, hjúskaparstaða, menntunarstig, blóðflokkur, hvort ákveðinn sjúkdómur eða einkenni er til staðar eða ekki, og svo framvegis.
Fylgnistuðull getur verið á bilinu -1 til 1. Gildið -1 sýnir að um fullkomna neikvæða fylgni er að ræða (aukning á A hefur í för með sér línulega minnkun á B), gildið 1 endurspeglar fullkomna jákvæða fylgni (aukning á A hefur í för með sér línulega aukningu á B) og gildið 0 sýnir að ekki er fylgni milli A og B.
Rétt er að taka fram að fylgnistuðull lýsir ekki umfangi línulegrar breytingar á einni breytu með tilliti til annarrar. Ef reiknaður er til dæmis fylgnistuðull milli líkamsþyngdar og hæðar þá segir hann ekki til um hve mikillar þyngdaraukningar má að meðaltali vænta fyrir skilgreinda aukningu á hæð. Til þess eru notaðar aðrar aðferðir, til dæmis línuleg aðhvarfsgreining.
En hvaða aðferðir má þá nota til að meta tengsl breyta sem byggjast ekki á hlutfallskvarða og þar sem fylgnistuðull á því ekki við? Til eru ýmsar aðferðir til að meta slík tengsl og við val á heppilegustu nálguninni er nauðsynlegt að hafa í huga kvarðann sem breyturnar byggjast á og nákvæma skilgreiningu á rannsóknarspurningunni sem liggur fyrir. Ef við viljum vita hvort tveir rannsakendur túlka niðurstöður á sama hátt þegar þær eru lagðar fyrir þá hvorn í sínu lagi og þeir beðnir að gefa ákveðið skor, þá má reikna samræmishlutfall á milli þeirra (kappa) og jafnvel taka tillit til þess hve miklar líkur eru á að þeir gefi sama skor af tilviljun einni saman (vegið kappa). Ef kanna á hvort samhengi er milli tekna og þess að búa í ákveðnum borgarhluta má hins vegar nota kí-kvaðrat próf um sjálfstæði þessara tveggja breyta (test of independence). Slíkt próf byggir á kí-kvaðrat dreifingu og hentar því þegar um er að ræða breytur sem fylgja þeirri dreifingu.