pc를 도구삼아 일하기엔 좋은 세상입니다. AI를 비롯..
점점 신세계를 봅니다. OCR 이란?
광학 문자 인식 (Optical Character Recognition) 인쇄된 책이나 손으로 쓴 문자를 인식하여 기계가 읽을 수 있는 텍스트 형식으로 변환하는 기술입니다. 급하게 딸이 학교 과제때문에 책 몇페이지를 사진으로 찍어서 출력을 부탁하는데...
해보신분들은 아시겠지만... 다운로드 후, 편집없이 날 것 그대로 프린트하면 보기가 영 그렇죠.
알pdf 프로그램에서 이미지형태의 문서를 자체 ocr로 문자 인식해주는 기능이 있긴한데, 이 경우에는 파일 확장자가 pdf 즉, pdf로 저장된 이미지형태의 문서만 지원하네요. 혹시나 싶어 찾아보니 역시!
있습니다. 온라인이라서 설치도 필요없습니다.
사진 이미지 1페이지씩 했는데.. 속도도 빠르고 인식률도 상당히 좋습니다.
원본이 교양서적을 휴대폰으로 찍은거다보니 책의 머릿글 등이 본문에 섞이는 것과 기호, 띄워쓰기 정도만 수정해주면되더군요...