Chat GPT의 운영사인 Open AI가 지난 13일(현지시간), 신형 AI 'GPT-4o'(포오)를 발표했다. GPT-4o의 ‘o’는 하나의 통합된 AI 모델을 의미하는 ‘옴니모델(omnimodel)’을 뜻한다.
음성 인식, 스피치-투-텍스트(Speech to text), 이미지 인식 기능 등이 통합되었다. 대화형 인터페이스 형태로 자연스러운 실시간 상호작용이 가능해졌다.
특히 오픈 AI는 복잡한 기술 향상보다는 사용자의 사용 편의성과 AI를 실제 우리 삶에 좀 더 쉽게 활용할 수 있도록 구현해 내는 것에 집중했다. 신형 AI의 반응 속도는 빠른 경우 232밀리초(1,000분의 1초), 평균 320밀리초이다.
실제로 사람들이 대화할 때의 반응 속도를 고려하였으며, 사람의 감정을 읽고 농담 등 자연스러운 대화가 가능해졌다고 오픈 AI 측은 밝혔다. GPT 3.5 vs GPT-4o, 어떤 점이 달라졌을까?
POINT 1 영화 'HER'가 현실로? GPT-4o의 핵심 기능 중 하나는 ...