PDF 텍스트추출 OCR 입니다
PDF텍스트추출 OCR 입니다 텍스트로 되어 있는 PDF 파일이나 이미지 파일등에 문자를 추출하는 기술이 바로 OCR(Optical Character Recongnition) 입니다. 바로 공항 문자 인식 기술입니다. 요새 명함을 사진으로 찍어 문자 부분만 추출하는 앱도 이 기술을 사용한겁니다. 보안상 읽기 전용 프로그램인 pdf 파일이 있을 때 텍스트를 추출하고 한다면 아크로밧리더 프로버전은 가능하지만 비싸서 사용하기 힙니다. ^^ 작은 문서인 경우 무료로 이용할 수 있습니다. 아래 사이트로 접속합니다. ReTIA홈페이지 홈페이지에 접속하면 상단 메뉴 중 서비스 - ROSE 문서 인식을 선택합니다. ROSE 문서인식 서비스에 대한 설명이 나와 있습니다. 입력 이미지 포맷은 BMP, JPEG, PING,..