이쯤되면 나도 나의 정체성을 모른다. 요즘 나는 여러 일들을 해보고 있으며, 오늘은 그것 중 하나를 기록한다.
이건 먼 미래에 하고싶다고 생각했던 일인데, 연습삼아 해보고 있다. @X, DeepSeek AI 올해 상반기, 미국 빅테크 기업(엔비디아 등)에 쇼크가 찾아왔다.
DeepSeek 때문이었다. 중국의 량원펑이라는 사람이 DeepSeek LLM을 개발해 발표한 후 이 DeepSeek의 성능이 Meta, Open AI, Google 등 우리가 아는 유명한 LLM을 상회하는 것으로 드러났다.
사실 새로운 LLM이 개발되고 이전 LLM 성능을 추월하는 건 생각보다 흔히 있는 일이었는데, 문제는 DeepSeek의 비용경쟁력이었다. 결국 이 사실은 빅테크 전반에서 시장 전반으로 확산되어 시장 전반의 급락을 불러왔다.
나도 이정도로만 이해하고 있었는데, DeepSeek에서 OCR 모델을 하나 개발해서 발표했다. 지난 달 20일 전후로 발표되었으니, 이제 한달 쯤 되었다.
DeepSeek는...
원문 링크 : [잡담] 요즘 하는 일: DeepSeek_OCR