이미지 To 텍스트 - 0.소개
ㅁ 개요
O 프로젝트 소개
- 이번 프로젝트는 파이썬을 이용하여 이미지에서 텍스트를 추출하는 프로그램을 만들어 보도록 하겠습니다.
O 사전 준비 사항
1.GUI 프로그램을 아나콘다에 기본 내장되어 있는 qt5를 이용하여 만들 것입니다. 따라서 아나콘다를 설치해야 합니다.
>아나콘다 설치(또는 개별설치 가능)
2.또한 이미지를 텍스트로 변환해주는 파이썬 모듈 pytesseract를 사용하기 위해서 Tesseract 프로그램을 설치 및 환경변수를 설정해야 합니다.
> Tesseract 프로그램 다운로드/설치 및 환경변수 설정
> pip install tesseract
3.이미지에서 한글을 추출하기 위해 아래 파일이 필요합니다.
>kor.traineddata (아래 사이트에서 다운로드)
https://github.com/tesseract-ocr/tessdata/blob/main/kor.traineddata
>다운로드 위치 : Tesseract가 설치된 폴더 아래에 tessdata 폴더 밑에 파일을 위치 시켜야 함
예) C:\Program Files\Tesseract-OCR\tessdata
O 진행 순서
진행 순서는 크게 아래와 같습니다.
1.텍스트 이미지to텍스트 프로그램
-가장 간단한 코드로 이미지에서 텍스트를 뽑아내는 방법을 보여줍니다. 이를 위해 Tesseract 프로그램을 다운로드하고 설치 후 환경변수 설정하는 것까지 알아보겠습니다.
2.GUI 이미지to텍스트 프로그램
-GUI 빈창을 띄워 보는 것 부터 시작해서, 단계적으로 살을 붙이고 이미지를 불러오면 이미지에서 텍스트로 변환하는 프로그램을 만드는 방법을 알아보겠습니다.
3. GUI 이미지to텍스트 프로그램 : 이미지 드래그&드롭 버전
- 위 2번의 GUI 이미지to텍스트 프로그램을 업그레이드하여 이미지를 drag&drop 하면 자동으로 이미지의 텍스트를 뽑아주는 프로그램을 만드는 방법에 대하여 살펴보겠습니다.
위의 내용이 유익하셨다면, 광고 한번씩만 클릭 부탁드립니다.
감사합니다.