1. 텍스트 자료의 표현과 처리 인공지능도 사람과 유사하게 단어를 중심으로 독립된 단어를 처리하고 단어들의 순차적 배열을 분석하여 의미를 찾고 이해한다.
정해진 형식에 맞추어 정리한 자료를 정형 자료, 그렇지 않은 자료를 비정형 자료라 하며, 정형 자료는 키와 몸무게와 같이 연속된 값을 갖는 연속형 자료와 성별이나 거주 지역과 같이 동일한 성질을 가진 범주형 자료로 구분되며, 비정형 자료는 영상이나 이미지, 음성, 뉴스 기사, SNS 등이 있어 정형 자료로 가공하는 과정이 필요하다. 텍스트 자료를 집합으로 표현하기 : 문장을 구성하는 주요 단어들을 분리하여 집합(배열 인덱스)으로 표현하면 해당 자료의 특징을 분석할 수 있으나, 원소들 사이의 순서를 고려하지 않기에 충분한 정보를 얻기에는 한계가 있다.
단어를 벡터로 표현하기 : 가장 일반적이고 기본적인 방법으로, 주요 단어의 포함 여부와 단어의 빈도수를 나타내는 벡터를 활용하여 정보를 인식한다. 또한, 하나의 성분을 1로 놓고 나머지...
원문 링크 : 인공지능 수학 - 자료의 표현