tesseract-ocr 3.02 을 활용한 문자 인식 예제
프로그래밍 언어/C++ 2015. 2. 23. 02:22
1. OCR 이란??? 광학 문자 인식(Optical Character Recognition) 위키백과 중에서... OCR이란 인쇄된 문서나 손으로 쓴 글씨 등에서 텍스트(문자)를 추출하여 문자인식이 가능하도록 하는 기술입니다.이미지의 해상도 및 품질에 따라 인식률이 달라지며, 세계 각국의 언어를 추출할 수 있습니다. 쉽게 말해서 이미지(그림파일)등에 있는 텍스트(문자)들을 추출하여 텍스트로 변경하는 것이라고 생각하면 됩니다. 사진출처 : http://www.athento.com/en/ocr/ 2. Tesseract-ocr 컴파일을 통한 라이브러리 생성 tesseract-ocr 을 이용하여 OCR 프로젝트를 사용하기 위해서는 tesseract-ocr 라이브러리를 먼저 생성하여야 사용자 프로젝트 예제에 적..