AI 모델이 점점 복잡해지면서 성능 최적화가 중요한 이슈로 떠오르고 있습니다. NVIDIA는 오픈소스인 DeepSeek-R1과 Inference-Time Scaling(ITS) 기술을 활용해 GPU 커널 생성을 자동화하는 방식을 제안했습니다.
오늘 MDS테크에서는 해당 기술이 AI 개발에 어떤 영향을 미치는지, 더 나아가 CUDA 기반 GPU 성능 향상 방법에 대한 'NVIDIA 뉴스'입니다. 기사 전문은 다음 링크에서 확인하실 수 있습니다.
DeepSeek-R1 및 추론 시간 스케일링을 통한 GPU 커널 생성 자동화 AI 모델이 점점 더 정교한 문제를 해결하기 위해 기능을 확장하면서, 테스트 시간 확장 또는 추론 시간 확장이라는 개념이 등장하고 있습니다. 이 기술은 AI가 추론 중에 추가적인 컴퓨팅 리소스를 할당하여 여러 가지 가능한 결과를 평가한 후, 가장 적합한 신경망을 선택함으로써 모델의 성능을 향상시키는 방식입니다.
이를 통해 AI는 인간이 복잡한 문제를… developer...