데이터 분석을 위해 #pandas 와 #spark 등을 공부했는데 , 이런 툴을 이용해서 제대로 된 분석을 할 수 있는 기초가 부족하여 #데이터분석의힘 이라는 책을 읽고 후기를 남기려 한다. 책 줄거리만 적는게 아니라, 내용에 대한 나의 의견도 적는 것임을 밝힌다. 1.
데이터의 상관관계는 인과관계가 아니다. #데이터분석의 힘 신문 기사를 읽어보면 xx 회사는 올해 매출이 xx 만큼 올랐다.
참고로 작년에 xx 사장을 영입했다.. 와 같이 매출증가를 사장 영입의 결과.
즉 서로 인과관계라는 뉘앙스로 적힌 기사들을 많이 본다. 이런걸 볼 때마다 객관적이지 않은 기사라고 생각이 들었다.
매출 증가의 원인이 엄청 많을 것인데 왜 xx 사장 영입이 주요 원인인것처럼 적는걸까? 이 기자는 요인들을 다 분석하고나 이런 글을 적은걸까?
이런 나의 생각과 일치하는 문구인것 같다. "데이터의 상관관계는 인과관계가 아니다"..
이 책에서는 예로 "광고를 했더니 아이스크림 매출이 올랐다', 전기요금을 ...
#
pandas
#
spark
#
데이터분석의힘
#
AB테스트
#
블록무작위배정
#
분석
#
무작위비교시행
#
무작위대조시험
#
랜덤화비교시험
#
데이터
#
data
#
충화무작위배정
원문 링크 : '데이터 분석의 힘' 독서 후기 - 1