로딩
요청 처리 중입니다...

Yellowbrick을 통한 데이터 레이크(Data Lake) 문제점 해결 및 실시간 데이터 분석

 Yellowbrick을 통한 데이터 레이크(Data Lake) 문제점 해결 및 실시간 데이터 분석

데이터 레이크(Data Lake)는 방대한 양의 원천 데이터(Raw Data)를 원본 그대로 저장할 수 있는 통합 데이터 저장소인데요. 정형 데이터뿐만 아니라 동영상, 소셜 데이터 등의 비정형 데이터까지 함께 수집하고 분석할 수 있어 매우 효과적이고 경제적인 시스템입니다.

그러나 데이터 레이크도 기업에 비즈니스 인사이트를 제공할 목적으로 사용하기에는 몇 가지 문제점들이 있는데요. 대규모 데이터를 분석하는 데 느린 속도를 보이며 100% 신뢰하기 어려운 분석 결과를 나타냅니다.

그런데 데이터 레이크에서 보다 많은 인사이트를 얻는 것은 얼마나 중요할까요? 최근 조사 결과에 따르면 95% 이상의 IT 관리 직원들이 데이터 레이크에서 보다 많은 인사이트를 얻는 것이 중요하다고 답했습니다.

기존 하둡/클라우드 기반 데이터 레이크의 문제점 1. 다수의 동시 사용자 지원 불가 2.

성능이 좋지 않음 3. 데이터 집약 리포트 및 Ad-hoc, 대화식(Interactive) 또는 복잡한 쿼리 분석에...

# DataLake # 클라우드 # 쿼리엔진 # 잘레시아 # 옐로브릭 # 실시간데이터관리 # 실시간데이터 # 데이터웨어하우스 # 데이터레이크 # 대량로드 # Yellowbrick # 하둡