데이터 웨어하우스는 비휘발성(NonVolatile)을 특징을 가지고 있으므로, 일단 데이터가 적재되면 일괄 처리 (Batch처리)외에는 별도의 갱신이 이루어지지 않는다. 데이터웨어하우스는 데이터를 주제별로 저장하기 때문에 최종사용자 혹은 전산 지식에 약한 분석자도 이해하기 쉬운 형태를 취한다.
맵리듀스에서 블록크기의 기본값은 64MB이고, 맵 태스크하나가 1개의 블록을대상으로 연산을 수행한다. 따라서 320MB 크기의 파일을 대상으로 작업을 수행하면 5개의 맵 태스크가 생성된다 (320/64=5개) 데이터 스테이징 단계에서는 정기적인 ETL과 실시간 ETL을 혼용할 수 있고, 저장되는 테이블의 스키마는 데이터 원천의 구조에 의존한다.
데이터 원천과 스테이징 테이블과의 매핑은 일대일 혹은 일대다로 구성될수.....
원문 링크 : ADsP 기출문제 오답노트 - 이론 정리 2