로딩
티스토리 데이터 처리 중입니다.

[개발자를 위한 LLM] 트랜스포머 구조 (Transformer High-level Architecture)

 [개발자를 위한 LLM] 트랜스포머 구조 (Transformer High-level Architecture)

이번 포스팅에서는 트랜스포머의 구조에 대해서 알아보겠습니다.우선 최상위 구조를 알아보고, 각 구성요소에 대해서 자세히 설명하도록 하겠습니다. 트랜스포머의 구조트랜스포머는 크게 인코더와 디코더로 구성되어 있습니다.인코더 (Encoder): 소스 시퀀스의 정보를 압축해 디코더로 보내는 역할디코더 (Decoder): 인코더가 보내 준 소스 시퀀스 정보를 받아서 타깃 시퀀스를 생성 인코더는 입력 시퀀스(예: 텍스트)를 처리하고, 이 시퀀스의 정보를 컨텍스트로 변환하는 역할을 합니다.

트랜스포머의 인코더는 여러 개의 인코더 레이어 층으로 구성됩니다. 트랜스포머 논문에서는 6개의 인코더 층을 제안했지만, 인코더 층의 개수는 성능에 크게 영향을 주는 요소는 아닙니다.디코더는 인코더로부터 얻은 정보를 바탕으로 출력 시.....