이번 포스팅에서는 HDFS에서 파일 읽기에 대해서 정리했습니다. [HDFS 파일 읽기] - 클라이언트에서 네임 노드의 입력 스트림 객체(DFSInputStream)를 통해 스트림 객체를 생성한다. - 생성된 스트림 객체를 이용하여 기본 블록의 10 배수 만큼 조회한다. - 클라이언트 스트림 객체에서 블록 리더기를 생성한다. - DFSInputStream은 파일을 모두 읽을때까지 블록을 조회한다.
모두 읽었다면 close를 통해 닫아야 한다. DFSInputStream을 생성하고 클라이언트가 반환 받는 과정입니다. 1.
스트림 요청 > open() 메서드를 호출해 스트림을 요청합니다. 2. DFSClient에게 스트림 생성 요청 > 마찬가지로 open() 메서드를 호출해 DFSInputStream 객체를 생성합니다. 3.
읽어오기 위한 파일의 블록 위치를 요청합니다. > getBlockLocataion() 메서드를 호출해 파일 블록 위치를 요청합니다. 4. 블록의 위치 값을 반환해줍니...
#
client
#
데이터노드
#
데이터분석
#
데이터엔지니어
#
데이터전송
#
분산처리
#
분산처리시스템
#
분산파일
#
블록
#
블록구조
#
읽기
#
클라이언트
#
파일읽기
#
파일저장
#
데이터
#
노드
#
data
#
dataanalysis
#
datanode
#
DFS
#
hadoop
#
HDFS
#
InputStream
#
JVM
#
namenode
#
node
#
read
#
write
#
네임노드
#
하둡
원문 링크 : HDFS 구조[4] 파일 읽기(하둡)