@ 하둡 - 현재 아파치 소프트웨어 재단의 소속으로 개발되어 지고 있으며, - 구글의 분산 처리 시스템 관련 논문으로 부터 개발 시작됨 - 하둡이란 이름은 아이의 코끼리 장난감 이름에서 따온것으로 알려짐 @ 하둡 분산처리 시스템(HDFS) # Name Node - 데이터 노드들을 관리 # Data Node - 실제값들은 네임노드를 거쳐 데이터노드에 저장되며 - 각 네임노드들은 서로의 클론 형태 - 블록사이즈는 64mb 혹은 128mb 단위로 대용량 데이터에 적합한 크기임 @ 흐름도 - 어플리케이션단에서 데이터 저장요청시 네임노드가 저장할 데이터노드를 지시 - 해당 데이터노드에 저장되면 그 시점 이후 다른 네이터노드에 똑같이 저장된다 - 이 과정에서 하나라도 다른 데이터노드에서 저장 실패시 저장실패 처리된다 - 운영중 데이터노드 장애발생시 또 하나의 데이터노드를 추가하여 유지시킴...
원문 링크 : 하둡(Hadoop) - HDFS