로딩
요청 처리 중입니다...

딥러닝으로 압축하는 시대: SoundStream 코덱 기술이란?

 딥러닝으로 압축하는 시대: SoundStream 코덱 기술이란?

음성 통화, 유튜브, 팟캐스트, 화상회의... 우리가 매일 접하는 오디오는 대부분 압축 코덱을 통해 전송됩니다.

그런데 최근 Google이 발표한 SoundStream이라는 코덱은, 기존 기술과는 차원이 다른 방식으로 오디오를 압축합니다. SoundStream은 기존 DSP 기반 코덱이 아닌, 완전한 딥러닝 기반 오디오 코덱입니다.

SoundStream이란? SoundStream은 Google Research가 2021년에 발표한 신경망 기반(end-to-end neural) 오디오 코덱입니다.

기존 코덱들이 규칙 기반(DSP) 알고리즘을 활용했다면, SoundStream은 학습된 인코더-디코더 구조를 통해 오디오를 압축합니다. 간단히 말하면, 사람이 만든 압축 규칙이 아니라, 딥러닝 모델이 직접 압축 방식과 복원 방식까지 학습한 것입니다.

구조 요약: SoundStream의 구성 요소 SoundStream은 크게 다음 세 부분으로 구성됩니다: 1. Encoder 원본 오디오를 ...