로딩
요청 처리 중입니다...

中 DeepSeek, 95% 저렴한 OpenAI o1급 성능의 'R1' 모델 공개

 中 DeepSeek, 95% 저렴한 OpenAI o1급 성능의 'R1' 모델 공개

https://github.com/deepseek-ai/DeepSeek-R1/ GitHub - deepseek-ai/DeepSeek-R1 Contribute to deepseek-ai/DeepSeek-R1 development by creating an account on GitHub. github.com - 1년 전에 설립된 중국의 AI 스타트업, 'DeepSeek'이 1세대 추론 모델인 'DeepSeek-R1' 모델과 'DeepSeek-R1-Zero' 모델을 공개 - 'DeepSeek-R1-Zero' 모델은 Supervised Fine Tuning (SFT) 없이 Reinforcement Learning (RL)만으로 완성된 모델. - RL만으로도 Chain-of-Thought를 비롯한 패턴을 습득하여 강력한 추론 성능을 얻을 수 있다는 점을 보여줌. - 'DeepSeek-R1'은 'DeepSeek-R1-Zero'를 기반으로 SFT를 적용해 언어 처리 능력을 더욱 강화한 모델. ...