파이썬 AI 실습/Gemini AI & Vertext AI API 사용 하기

Gemini AI & Vertext AI API 사용 하기 - 3.이미지속 텍스트 추출하기

파기차차 2023. 12. 24. 19:39
728x90
반응형
SMALL

좋은 내용의 글들이 계속 올려질 수 있도록 "공감" 버튼을 꾹 눌러주세요.

 

 

 

ㅁ 개요

 

O 프로그램 소개

 

- 이번 글은 이전글(2023.12.24 - [분류 전체보기] - Gemini AI & Vertext AI API 사용 하기 - 2.기본 사용법 알아보기)에 이은 4번째 글로 이미지속의 텍스트를 추출해 내는 방법에 대해 알아 보겠습니다.

 

 

 

 

O 준비 사항

 -프로그램이 정상적으로 실행되기 위해서는 아래 이미지가 필요합니다.

아래 이미지파일을 다운로드하여 img폴더 아래에 위치시켜 주시기 바랍니다.

 

handwrite.png
0.09MB

 

 

 

O 완성된 프로그램 실행 화면

 

 

 - 본 포스팅의 최종 완성된 프로그램의 결과화면은 아래와 같습니다.

 

1.프로그램을 실행하면 아래와 같이 동작 합니다.

 

 

- 소스파일을 실행하면 아래와 같이 Loaded 1~~~~이 표시되면서 하단의 이미지가 뜹니다.

이미지를 닫으면 다시 아래 커맨드창에서 prompt(질의)와 gemini(응답)을 정상적으로 받게 됩니다.

맨 아래 제미나이의 응답(Gemini)을 보면 아래 이미지의 텍스트("The best dreams happen when you are awake.")를 잘 뽑아온 것을 볼 수 있습니다.

 

 

 

 

 

 

 

 


 

 

 

 

 


 
 

 

O 주요 내용

 

1. 소스코드를 살펴보면 다음과 같습니다.

 

자세한 내용은 코드 옆의 주석을 참고하시기 바랍니다.

 

 

 

 

  

 

 

 

 

 

 

 

 

 

 


 

ㅁ 정리

 

O 우리가 배운 내용

 
 - 오늘은 구글의 제미나이 AI API를 이용하여  이미지속의 텍스트를 추출해 내는 방법에 대하여 알아 보았습니다.
 

 

다음 글에서는 이미지와 설명 예시를 주고, 특정 이미지를 이와 유사하게 설명하도록 프롬프트를 만드는 방법에 대하여 알아보겠습니다.

 

 

감사합니다.

 

 

 

 

좋은 내용의 글들이 계속 올려질 수 있도록 "공감" 버튼을 꾹 눌러주세요.

 

728x90
반응형
LIST