ChatGPT가 똑똑해지는 비밀, 벡터DB 7종 비교 요약 요즘 AI 챗봇이나 검색 서비스를 보면 "내 문서에서 답을 찾아주는" 기능이 정말 많아졌죠? 이걸 가능하게 해주는 핵심 기술이 바로 벡터 데이터베이스예요.
오늘은 이 벡터DB가 뭔지, 왜 필요한지, 어떤 종류가 있는지 초보자도 알기 쉽게 정리해봤어요. 벡터 데이터베이스가 뭔가요?
우리가 글을 쓰면 AI가 그 글을 숫자 배열로 바꿔요. 이걸 "임베딩"이라고 합니다.
예를 들면 이런 식이에요. "맛있는 파스타 맛집" → [0.23, -0.41, 0.88, ... ] "이탈리안 레스토랑 추천" → [0.21, -0.39, 0.91, ... ] 두 문장은 단어가 다르지만 의미가 비슷하죠?
숫자로 변환하면 이 "비슷함"을 계산할 수 있어요. 이 숫자 배열(벡터)을 저장하고 비슷한 것을 빠르게 찾아주는 게 벡터 데이터베이스예요.
왜 필요한 건가요? ChatGPT 같은 AI는 학습한 정보만 알고 있어요.
우리 회사 문서는 모르죠....
원문 링크 : 벡터 데이터베이스가 뭔데? AI 검색의 핵심 쉽게 정리