데이터 레이크(Data Lake)는 방대한 양의 원천 데이터(Raw Data)를 원본 그대로 저장할 수 있는 통합 데이터 저장소인데요. 정형 데이터뿐만 아니라 동영상, 소셜 데이터 등의 비정형 데이터까지 함께 수집하고 분석할 수 있어 매우 효과적이고 경제적인 시스템입니다.
그러나 데이터 레이크도 기업에 비즈니스 인사이트를 제공할 목적으로 사용하기에는 몇 가지 문제점들이 있는데요. 대규모 데이터를 분석하는 데 느린 속도를 보이며 100% 신뢰하기 어려운 분석 결과를 나타냅니다.
그런데 데이터 레이크에서 보다 많은 인사이트를 얻는 것은 얼마나 중요할까요? 최근 조사 결과에 따르면 95% 이상의 IT 관리 직원들이 데이터 레이크에서 보다 많은 인사이트를 얻는 것이 중요하다고 답했습니다.
기존 하둡/클라우드 기반 데이터 레이크의 문제점 1. 다수의 동시 사용자 지원 불가 2.
성능이 좋지 않음 3. 데이터 집약 리포트 및 Ad-hoc, 대화식(Interactive) 또는 복잡한 쿼리 분석에...
#
DataLake
#
클라우드
#
쿼리엔진
#
잘레시아
#
옐로브릭
#
실시간데이터관리
#
실시간데이터
#
데이터웨어하우스
#
데이터레이크
#
대량로드
#
Yellowbrick
#
하둡