다들 잘 아시겠지만, OCR[Optical Character Reader(광학식문자판독기)]란 문서에 새겨진 문자를 텍스트로 판독하는 프로그램입니다. 따라서 활자로 된 문서를 볼 수 없는 시각장애인들에게 OCR, 즉 문서인식프로그램은 매우 유용합니다.
국내에서 많이 사용되고 있고 한국어가 지원되는 OCR 프로그램으로는 국내 기술로 만들어진 아르미, 벨기에의 readifis, 그리고 러시아의 ABBYY사의 기술력으로 만들어진 Fine Reader가 있습니다. 우선 아르미는 도스 운영체제에서부터 꾸준히 문서 판독을 지원하여 오랜 기간 국내의 이용자들에게 알려져 왔습니다.
그러나 복잡한 문서 형식에 적절하게 대응하지 못하는 한계가 있고, 영문 인식율에 비해서 한글 인식율이 떨어진다는 사용자들의 평가가 있었습니다. 이에 반해 벨기에에서 만든 readiris는 아르미 보다 한국어 인식율을 보이며, 다양한 한글 포맷을 지원하고 있습니다.
다만, 한글 인식에 있어서 띄어쓰기를 정확하게 하지 못하...
#
abbyy
#
finereader
#
IT·컴퓨터
#
readiris
#
문자인식
#
문자판독
#
시각장애인
#
아르미
#
이미지문서화