Gemini AI & Vertext AI API 사용 하기 - 6.이미지를 이해하고, 이미지속 객체를 json형태로 추출하기

파이썬 AI 실습/Gemini AI & Vertext AI API 사용 하기

Gemini AI & Vertext AI API 사용 하기 - 6.이미지를 이해하고, 이미지속 객체를 json형태로 추출하기

파기차차 2024. 1. 4. 22:38

728x90

SMALL

좋은 내용의 글들이 계속 올려질 수 있도록 "공감" 버튼을 꾹 눌러주세요.

ㅁ 개요

O 프로그램 소개

- 이번 글은 이전글(2023.12.25 - [분류 전체보기] - Gemini AI & Vertext AI API 사용 하기 - 5.이미지속 특정 객체의 가격 알아 맞추기)에 이은 6번째 글로 이미지의 전반적인 내용을 구조화하고, 이를 프로그램에서 사용할 수 있도록 json형태로 추출하는 방법(프롬프트)에 대하여 알아보겠습니다.

O 준비 사항

-프로그램이 정상적으로 실행되기 위해서는 아래 이미지가 필요합니다.

아래 이미지파일을 다운로드하여 img폴더 아래에 위치시켜 주시기 바랍니다.

fish.png

0.56MB

O 완성된 프로그램 실행 화면

- 본 포스팅의 최종 완성된 프로그램의 결과화면은 아래와 같습니다.

1.프로그램을 실행하면 아래와 같이 동작 합니다.

먼저 gemini-pro-vision 모델에 의해 이미지 1장이 로드됩니다.

-이미지의 내용은 수산물별 가격표가 붙어 있는 이미지 입니다.

2. 아래와 같이 제미나이에게 프롬프트(질의)를 하였더니

Extract the items and prices from a fish market photo and output them in JSON : 수산시장 사진에서 품목과 가격을 추출하여 JSON으로 출력해줘

제미나이가 이미지속 수산물별로 구분하여 수산물의 이름/가격을 json 형태로 만들어 주었습니다.

3.아래는 위와 내용은 동일하며, 한글로 요청한 것인데,

4. 이것도 잘 답변해 주고 있는 것을 볼 수 있습니다.

다만, 위에서는 딕셔너리형태로 출력한 반면, 아래 한글의 경우 리스트 형태로 출력해 준것이 다소 차이가 있습니다.

O 주요 내용

1. 소스코드를 살펴보면 다음과 같습니다.

이전글의 소스와 동일하며 하단의 프롬프트 부분만 다르므로 그 부분만 설명합니다.

-아래와 같은 형식(이미지를 주고 이미지속 특정 부분의 내용을 json형태로 요구)으로 프롬프트를 작성할 수 있습니다.

이와 같이 작성하면 제미나이가 스스로 이미지의 내용을 파악하고, 특정 객체의 이름, 가격, 등을 우리가 요구하는 형태로 제공해 줄 수 있습니다.

ㅁ 정리

O 우리가 배운 내용

- 오늘은 구글의 제미나이 AI API를 이용하여 이미지의 전반적인 내용을 구조화하고, 이를 프로그램에서 사용할 수 있도록 json형태로 추출하는 방법(프롬프트)에 대하여 알아보았습니다.

다음 글에서는 단순 이미지를 보고, 이에 영감을 받아 스스로 스토리라인을 작성해 내는 프롬프트를 만들어 보겠습니다.

감사합니다.

좋은 내용의 글들이 계속 올려질 수 있도록 "공감" 버튼을 꾹 눌러주세요.

728x90

LIST

저작자표시 비영리 변경금지

'파이썬 AI 실습 > Gemini AI & Vertext AI API 사용 하기' 카테고리의 다른 글

Gemini AI & Vertext AI API 사용 하기 - 8.전체 이미지 내용을 보고 특정 객체 찾아내기 (0)	2024.01.04
Gemini AI & Vertext AI API 사용 하기 - 7.이미지를 보고 스토리라인 만들기 (0)	2024.01.04
Gemini AI & Vertext AI API 사용 하기 - 5.이미지속 특정 객체의 가격 알아 맞추기 (0)	2024.01.04
Gemini AI & Vertext AI API 사용 하기 - 4.이미지와 설명을 주고, 특정 이미지를 이와 동일하게 설명하기 (0)	2024.01.04
Gemini AI & Vertext AI API 사용 하기 - 2.기본 사용법 알아보기 (2)	2023.12.25

현재글Gemini AI & Vertext AI API 사용 하기 - 6.이미지를 이해하고, 이미지속 객체를 json형태로 추출하기

파기차차 - 우리 블로그의 목표 '파이썬 기초부터 차근 차근' 배워 보는 파기차차 블로그로는 고수님들을 위한 곳이 아니며, 이제 막 시작하시려는 분들, 코딩 초보자분들을 위한 블로그입니다. 우리 블로그의 목표는 아래와 같습니다. 1. 쉬운 코딩이어야 한다. 2. 빠르게 할 수 있어야 한다. 3. 즉시 할 수 있어야 한다. 4. 어딘가 써먹을 수 있어야 한다. 우리는 이 블로그를 통해 단기간 쉽고, 빠르게 파이썬을 익혀 즉시, 어딘가 써먹을 것입니다.

250x250

- 우리 블로그의 목표 '파이썬 기초부터 차근 차근' 배워 보는 파기차차 블로그로는 고수님들을 위한 곳이 아니며, 이제 막 시작하시려는 분들, 코딩 초보자분들을 위한 블로그입니다. 우리 블로그의 목표는 아래와 같습니다. 1. 쉬운 코딩이어야 한다. 2. 빠르게 할 수 있어야 한다. 3. 즉시 할 수 있어야 한다. 4. 어딘가 써먹을 수 있어야 한다. 우리는 이 블로그를 통해 단기간 쉽고, 빠르게 파이썬을 익혀 즉시, 어딘가 써먹을 것입니다.

k8s, 검색, 크롤링, 파이썬, 윈도우, 텔레그램, openai, gui, 파일전송, 쿠버네티스, ChatGPT, 초보, 셀레니움, 다운로드, Karlo, ftp서버, 구글클라우드플랫폼, API, FTP, 입문자,

Today :
Yesterday :

일	월	화	수	목	금	토
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30

내 블로그 - 관리자 홈 전환	`Q` `Q`
새 글 쓰기	`W` `W`

글 수정 (권한 있는 경우)	`E` `E`
댓글 영역으로 이동	`C` `C`

이 페이지의 URL 복사	`S` `S`
맨 위로 이동	`T` `T`
티스토리 홈 이동	`H` `H`
단축키 안내	`Shift` + `/` `⇧` + `/`

파기차차