로딩
요청 처리 중입니다...

RNAseq)edgeR 원리 3) TMM

 RNAseq)edgeR 원리 3) TMM

이전 포스팅에서 calcNormFactors 에 대해 설명했는데, 그 결과물인 effective library size 에 대해 설명해보겠다. cpm(counts-per-million)의 공식은 gene's counts / total counts * 1*10^6 이다. RNAseq의 경우 소수의 유전자들이 매우 높은 발현값을 가질 수 있다.

이로 인해 total counts의 값이 커지게 되고 낮은 발현을 가진 유전자들이더 낮은 값을 갖게 된다. 이를 보정해주는 방식 중 trimmed mean of M-values(TMM) 방식이 있으며 calcNormFactors 단계에서 이를 사용하여 total counts의 size 를 보정하는 scaling factors를 계산한다. effective library size = scaling factors * total counts 각 샘플당 1개의 scaling factors를 만들지만 이는 여러 샘플들 사이 most genes의 log-F...