LLM03: Training Data Poisoning

https://owasp.org/www-project-top-10-for-large-language-model-applications/assets/PDF/OWASP-Top-10-for-LLMs-2023-v1_1.pdf의 번역 자료입니다. Description 모든 머신러닝 접근의 시작점은 "원시 텍스트"라고 불리는 훈련 데이터입니다.

높은 능력(예: 언어적 및 세계 지식)을 갖추기 위해서는 이 텍스트가 다양한 분야, 장르 및 언어에 걸쳐 있어야 합니다. LLM 훈련 데이터에서 학습한 패턴을 기반으로 결과를 생성하기 위해 심층 신경망을 사용합니다.

Training Data Poisoning은 사전 훈련 데이터 또는 미세 조정이나 임베딩 과정에 사용되는 데이터를 조작하여 모델의 보안, 효율성 또는 윤리적 행동을 손상시킬 수 있는 취약점, 백도어 또는 편향을 주입하는 것을 의미합니다. Poisoning된 정보는 사용자에게 노출되거나 성능 저하, 하위 소프트웨어 악용 및 평판 손상과 같은 ...

요청 처리 중입니다...

LLM03: Training Data Poisoning

등록된 다른 글