Y : 종속변수 ß0 =모델절편 ß1, ß2 , ... , ßn = 각각의 공변량에 대해 glm으로 계산된 계수값 χ1, χ2 , ... , χn = 각각의 독립변수 ε = 오차항 공변량을 사용하면 어떤 부분에서 이점이 있을까? 공변량을 사용함으로서의 이점 : 간단하게 설명한다면 "잡음을 최소화" 할 수 있다는 이점이 있다.
예시로 치매를 들어보자면, Late Onset Alzheimer disease(LOAD)의 경우 Age와 Gender에 영향을 받는다고 알려져있다고 가정해보자(실제로도 그러하다). 그렇다면 아래와 같이 Age 와 Gender를 공변량으로 사용함으로서, SNP 외 다른 "잡음을 최소화" 할 수 있도록 보정해줄 수 있다.
참고자료 : https://www.cog-genomics.org/plink/2.0/assoc#glm Association analysis - PLINK 2.0 Association analysis Linear and logistic/Firth re...
원문 링크 : GWAS)로지스틱 회귀(3) - 공변량(covairate)