시작에 앞서 결론부터 말하자면 개인정보가 털릴 수가 없는 기술 상태이다. 이게 뭔 소리냐면, 어떤 답변을 하는 데 기준만 가져와서 적용한 게 맞다면, 개인정보가 빠져나갈 구멍 따위를 찾을 수 없다는 점이다.
왜 논란인가? 우선, 논란이 되는 부분부터 제대로 짚어야 한다.
챗지피티나 제미나이를 통해 여러 번 물어보다보면 언론이 일부 거짓을 말하는 걸 알 수 있다. 논란이 되는 부분은 아래와 같다.
비전 인코더 가중치(Weight) 복제 의혹: 네이버의 멀티모달 모델인 '하이퍼클로바X SEED 32B Think'의 비전 인코더(이미지를 수치화하는 모듈)가 Qwen 2.4 모델의 것과 코사인 유사도 99% 이상을 보인 것이 화근이다. 이는 단순히 "참고"를 넘어서 학습 결과물인 가중치 값을 가져다 쓴 것이다.
정부 사업의 목적은 미·중 기술 패권 경쟁 속에서 소버린 AI을 확보하는 것이다. 쉽게 말하면 기술 주권을 얻기 위한 사업의 일환이다.
그런데 정작 네이버가 핵심 모듈에 중국 기술을...
원문 링크 : 네이버 AI가 QWEN을? 개인정보는 어떻게되나.