이미지 To 텍스트

파기차차 2024. 9. 8. 10:44

728x90

SMALL

ㅁ 개요

- 이번 프로젝트는 파이썬을 이용하여 이미지에서 텍스트를 추출하는 프로그램을 만들어 보도록 하겠습니다.

1.GUI 프로그램을 아나콘다에 기본 내장되어 있는 qt5를 이용하여 만들 것입니다. 따라서 아나콘다를 설치해야 합니다.

>아나콘다 설치(또는 개별설치 가능)

2.또한 이미지를 텍스트로 변환해주는 파이썬 모듈 pytesseract를 사용하기 위해서 Tesseract 프로그램을 설치 및 환경변수를 설정해야 합니다.

> Tesseract 프로그램 다운로드/설치 및 환경변수 설정

> pip install tesseract

3.이미지에서 한글을 추출하기 위해 아래 파일이 필요합니다.

>kor.traineddata (아래 사이트에서 다운로드)

>다운로드 위치 : Tesseract가 설치된 폴더 아래에 tessdata 폴더 밑에 파일을 위치 시켜야 함

예) C:\Program Files\Tesseract-OCR\tessdata

진행 순서는 크게 아래와 같습니다.

1.텍스트 이미지to텍스트 프로그램

-가장 간단한 코드로 이미지에서 텍스트를 뽑아내는 방법을 보여줍니다. 이를 위해 Tesseract 프로그램을 다운로드하고 설치 후 환경변수 설정하는 것까지 알아보겠습니다.

2.GUI 이미지to텍스트 프로그램

-GUI 빈창을 띄워 보는 것 부터 시작해서, 단계적으로 살을 붙이고 이미지를 불러오면 이미지에서 텍스트로 변환하는 프로그램을 만드는 방법을 알아보겠습니다.

3. GUI 이미지to텍스트 프로그램 : 이미지 드래그&드롭 버전

- 위 2번의 GUI 이미지to텍스트 프로그램을 업그레이드하여 이미지를 drag&drop 하면 자동으로 이미지의 텍스트를 뽑아주는 프로그램을 만드는 방법에 대하여 살펴보겠습니다.

다음 글에서 위에서 말씀드린 진행순서에 따라 유튜브 동영상 다운로드하는 방법을 하나씩 자세히 설명 드리겠습니다.

위의 내용이 유익하셨다면, 광고 한번씩만 클릭 부탁드립니다.

감사합니다.

728x90

LIST