로딩
요청 처리 중입니다...

그럴듯한 통계의 함정들

 그럴듯한 통계의 함정들

그럴듯한 통계의 함정은 전투기의 생존 편향에서 시작된다. 제2차 세계대전 당시 출격했다가 귀환한 전투기를 분석해 어디를 보강할지 결정하자 많은 이가 날개와 동체를 두껍게 하는 데 초점을 맞췄다. 그러나 통계학자 아브라함 왈드는 반대 의견을 제시했다. 총알구멍이 많은 부위는 실제로 생존 가능성과 연결된 영역일 수 있고, 반대로 총상을 입고도 돌아오지 못한 부위가 진짜 취약점일 가능성이 크다는 점을 지적했다. 즉, 보이는 부분에만 집중하면 귀환한 사례의 특성에 의한 편향이 생겨 전체 위험을 과대평가하게 된다. 이것이 생존 편향이다. 이렇게 보이는 것만 믿고 판단하면, 실패한 사례는 눈에 들어오지 않아 전체 그림이 왜곡된다.

비만의 역설로 알려진 현상도 표본과 데이터 구성이 핵심이다. BMI가 높은 과체중 그룹이 일반적으로 더 오래 산다는 결과가 나오기도 하지만, 이를 단순히 BMI 하나로 해석하면 잘못된 결론에 도달한다. 암이나 만성질환으로 체중이 감소한 사례나 근육량이 많은 건강한 사람들까지 구분 없이 포함되기 때문이다. 결과적으로 정상 체중 그룹의 사망률이 상승하는 효과가 나타난다. 표본집단과 측정 방식이 얼마나 중요한지를 보여 주는 대표적인 사례다. 숫자가 그럴듯하더라도 전체 데이터를 정확히 분리하고 맥락을 고려하지 않으면 왜곡된 해석이 따라온다.

오늘날에도 비슷한 맥락의 사례가 많다. 초보 부모로서 아이를 어떻게 키워야 하는지에 대한 수많은 책과 사례를 들여다보다가 멈춰 선다. 진짜 필요한 것이 무엇인지 물으며, 불안감에 의해 다른 엄마들이 하고 있는 방식이라도 무턱대고 따라 하는 것은 피해야 한다. 중요한 것은 표본의 한계를 인지하고, 맥락과 다양성을 반영해 근거를 해석하는 능력이다. 결국 핵심은, 보이는 것에 의존하기보다 실제로 중요한 조건과 상황을 정확히 파악하는 데 있다. 따라서 통계의 핵심은 표본과 맥락을 명확히 구분하고, 보이는 현상 뒤의 비(非)보이는 요인을 면밀히 검토하는 데 있다.