<발췌: 과학기술&ICT 정책·기술 동향 263호> 1. 오픈AI, ‘보고 듣고 말하는’ 새로운 AI 모델 ‘GPT-4o’ 출시 챗GPT 선도자 오픈AI는 텍스트는 물론, 청각과 시각으로도 추론하고 이를 말할 수 있는 새로운 AI 모델 ‘GPT-4o’를 발표하며 다양한 시연 모습 공개(5.13.) ※ GPT-4o의 ‘o’는 하나의 통합된 AI 모델을 의미하는 ‘옴니모델(Omni model)’ 의미 - GPT-4o는 음성 인식, 스피치-투-텍스트(Speech to text), 이미지 인식 기능 등이 통합된 대화형 인터페이스 형태로 자연스러운 실시간 상호작용이 가능한 멀티모달(Multimodal) 모델 - 기존 GPT 모델이 글자(텍스트)를 통해 명령하는 방식이라면, GPT-4o는 음성, 텍스트, 시각물을 입력하면 AI가 추론하고 그 결과를 도출 ※ GPT-4 응답시간은 평균 5.4초, GPT-4o는 최소 232밀리초, 평균 320ms - 오픈AI는 복잡한 기술 향상보다는 AI가 실제...
#
Copilot
#
트릴리움
#
큐
#
코파일럿
#
제미나이
#
이마젠3
#
옴니모델
#
오픈AI
#
어니봇
#
비오
#
바이두
#
마이크로소프트
#
네이버
#
구글
#
GPT
#
Gemini
#
Cue
#
퍼플렉시티