일반적으로 GWAS 를 진행할 때, 처음부터 디자인을 하는 경우가 아니라면 open database를 사용하게 될 것텐데, 계층화(stratification)분석으로 Case Control 을 디자인한게 아니라면 Case 대비 많은 수의 Control samples 을 다루게 된다. Control samples이 많은 상태로 GWAS를 분석하면 나타날 수 있는 문제점들과 해결방안에 대해 이야기 해보자.
Control samples이 많은 상태로 GWAS를 분석하면 나타날 수 있는 문제점 1) 편향된 연관성 평가 : Case Control 그룹이 불균형하게 분포되면, 연구 결과가 Control 에 편향되어 실제로는 유의미하지 않은 변이가 통계적인 불균형으로 인해 특정 질병과 연관성을 나타날 수 있음. 2) 상대적으로 적은 수의 Case의 검정력을 낮춤 : 표본 크기가 작은 케이스 그룹은 통계적 검정력(힘)을 낮추게 됨으로 유전적 연관성을 식별하기 어렵게 만들 수 있음. 3) 위험율의 ...
원문 링크 : Imbalance GWAS 해결방법