"이미지도, 음성도, 신호도… U-Net이면 일단 된다" 딥러닝 모델 중에 "어디든 써도 잘 작동하는 모델"이 있을까요? 정답에 가장 가까운 후보 중 하나는 바로 U-Net입니다.
처음엔 의학 이미지 분할을 위해 등장했지만, 지금은 이미지 복원, 노이즈 제거, 음성 분리, 해상도 복원, 마스크 생성, 경계 검출, 전처리 필터링 등 말 그대로 전처리의 전천후 솔루션으로 자리 잡았습니다. 딥러닝에서 무언가 ‘깨끗하게 만들고’, ‘원본에 가까워지게’ 하고 싶다면?
U-Net을 먼저 떠올리는 이유가 있습니다. U-Net은 어떤 구조인가요?
U-Net은 "U자형 인코더-디코더 구조"를 가지고 있습니다. 구조 설명 인코더 (왼쪽) 입력을 다운샘플링하며 정보의 요약을 수행 (Context를 파악) 스킵 커넥션 중간 레이어의 특징 맵을 디코더에 전달하여 세밀한 정보 보존 디코더 (오른쪽) 업샘플링을 통해 해상도 복원 및 세부 정보 재구성 이 구조 덕분에 U-Net은 입력의 공간 정보(위치 ...
원문 링크 : [딥러닝] U-Net: 전처리 분야의 만능 플레이어