Gemini AI & Vertext AI API 사용 하기 - 8.전체 이미지 내용을 보고 특정 객체 찾아내기

파이썬 AI 실습/Gemini AI & Vertext AI API 사용 하기

Gemini AI & Vertext AI API 사용 하기 - 8.전체 이미지 내용을 보고 특정 객체 찾아내기

파기차차 2024. 1. 4. 22:41

728x90

SMALL

좋은 내용의 글들이 계속 올려질 수 있도록 "공감" 버튼을 꾹 눌러주세요.

ㅁ 개요

O 프로그램 소개

- 이번 글은 이전글(

2023.12.25 - [분류 전체보기] - Gemini AI & Vertext AI API 사용 하기 - 7.이미지를 보고 스토리라인 만들기)에 이은 8번째 글로 이미지 속 여러 객체들 중에서 특정 객체를 찾아내는 프롬프트 예시를 살펴보겠습니다.

O 준비 사항

-프로그램이 정상적으로 실행되기 위해서는 아래 이미지가 필요합니다.

아래 이미지파일을 다운로드하여 img폴더 아래에 위치시켜 주시기 바랍니다.

global_ceo2.png

0.80MB

O 완성된 프로그램 실행 화면

- 본 포스팅의 최종 완성된 프로그램의 결과화면은 아래와 같습니다.

1.프로그램을 실행하면 아래와 같이 동작 합니다.

먼저 gemini-pro-vision 모델에 의해 이미지 1장이 로드됩니다.

-이미지의 내용은 글로벌 빅테크의 CEO들 입니다.

2. 아래와 같이 제미나이에게 프롬프트(질의)를 하였더니

"사진속에서 일론머스크를 찾아서 번호 알려줘"

제미나이가 이미지속 인물들을 파악하여 해당하는 사람(일론머스크)의 번호를 정확히 알아 맞췄습니다.

O 주요 내용

1. 소스코드를 살펴보면 다음과 같습니다.

이전글의 소스와 동일하며 하단의 프롬프트 부분만 다르므로 그 부분만 설명합니다.

-아래와 같은 형식(이미지를 주고 이미지속 인물 정보 찾아내기)으로 프롬프트를 작성할 수 있습니다.

이와 같이 작성하면 제미나이가 스스로 이미지의 내용을 파악하고, 이미지속의 인물이 누구인지 정확히 찾아낼 수 있습니다.

ㅁ 정리

O 우리가 배운 내용

- 오늘은 구글의 제미나이 AI API를 이용하여 이미지 속 여러 객체들 중에서 특정 객체를 찾아내는 프롬프트 예시를 살펴보았습니다.

다음 글에서는 이미지속 객체를 보고 각 객체들의 크기를 예상하는 프롬프트 예시를 살펴보겠습니다

감사합니다.

좋은 내용의 글들이 계속 올려질 수 있도록 "공감" 버튼을 꾹 눌러주세요.

728x90

LIST

저작자표시 비영리 변경금지 (새창열림)

'파이썬 AI 실습 > Gemini AI & Vertext AI API 사용 하기' 카테고리의 다른 글

Gemini AI & Vertext AI API 사용 하기 - 10.영상의 내용을 보고 어떤 영상인지 설명하기 (0)	2024.01.16
Gemini AI & Vertext AI API 사용 하기 - 9.이미지속 객체의 크기 예상하기 (0)	2024.01.04
Gemini AI & Vertext AI API 사용 하기 - 7.이미지를 보고 스토리라인 만들기 (0)	2024.01.04
Gemini AI & Vertext AI API 사용 하기 - 6.이미지를 이해하고, 이미지속 객체를 json형태로 추출하기 (0)	2024.01.04
Gemini AI & Vertext AI API 사용 하기 - 5.이미지속 특정 객체의 가격 알아 맞추기 (0)	2024.01.04

현재글Gemini AI & Vertext AI API 사용 하기 - 8.전체 이미지 내용을 보고 특정 객체 찾아내기

250x250

- 우리 블로그의 목표 '파이썬 기초부터 차근 차근' 배워 보는 파기차차 블로그로는 고수님들을 위한 곳이 아니며, 이제 막 시작하시려는 분들, 코딩 초보자분들을 위한 블로그입니다. 우리 블로그의 목표는 아래와 같습니다. 1. 쉬운 코딩이어야 한다. 2. 빠르게 할 수 있어야 한다. 3. 즉시 할 수 있어야 한다. 4. 어딘가 써먹을 수 있어야 한다. 우리는 이 블로그를 통해 단기간 쉽고, 빠르게 파이썬을 익혀 즉시, 어딘가 써먹을 것입니다.

openai, 쿠버네티스, 크롤링, 초보, API, 파일전송, 파이썬, 윈도우, ftp서버, gui, 셀레니움, ChatGPT, 검색, FTP, Karlo, 다운로드, k8s, 구글클라우드플랫폼, 입문자, 텔레그램,

Today :
Yesterday :

파기차차