컴퓨터 음성 인식(ASR) 개념 숨겨졌던 정보들 컴퓨터 음성 인식(ASR) 개념 한번 알아보는 것도 컴퓨터 음성 인식(ASR, Automatic Speech Recognition)은 컴퓨터 시스템이 인간의 음성을 인식하고 이해하는 기술입니다. ASR은 음성 신호를 분석하여 음성에서 단어, 문장 또는 명령어를 추출하고 이를 텍스트 형태로 변환합니다.ASR 시스템은 다음과 같은 여러 단계로 구성됩니다.
첫 번째 단계는 음성 신호의 전처리로, 음성 신호의 노이즈 제거, 필터링 또는 음성 신호의 크기 조절 등이 이루어집니다. 이후 음성 신호는 일련의 시간적인 프레임으로 분할됩니다.다음 단계는 특징 추출입니다.
각각의 프레임에서 주파수 스펙트럼의 특징을 추출하여 음성 신호의 주요 특징을 반영하는 벡터 형태로 변환합니다. 일반적으로 MFCC(Mel Frequency Cepstral Coefficients)와 같은 특징 추출 방법이 사용됩니다.이러한 특징 벡터는 다음 단계인 음향 모델에 사용됩니...
원문 링크 : 컴퓨터 음성 인식(ASR) 개념 숨겨졌던 정보들