Gemini AI & Vertext AI API 사용 하기 - 9.이미지속 객체의 크기 예상하기

파이썬 AI 실습/Gemini AI & Vertext AI API 사용 하기

Gemini AI & Vertext AI API 사용 하기 - 9.이미지속 객체의 크기 예상하기

파기차차 2024. 1. 4. 22:43

728x90

SMALL

좋은 내용의 글들이 계속 올려질 수 있도록 "공감" 버튼을 꾹 눌러주세요.

ㅁ 개요

O 프로그램 소개

- 이번 글은 이전글(2023.12.25 - [분류 전체보기] - Gemini AI & Vertext AI API 사용 하기 - 8.전체 이미지 내용을 보고 특정 객체 찾아내기)에 이은 9번째 글로 이미지속 객체를 보고 각 객체들의 크기를 예상하는 프롬프트 예시를 살펴보겠습니다.

O 준비 사항

-프로그램이 정상적으로 실행되기 위해서는 아래 이미지가 필요합니다.

아래 이미지파일을 다운로드하여 img폴더 아래에 위치시켜 주시기 바랍니다.

predict_height.png

0.51MB

predict_height_원본.png

0.52MB

O 완성된 프로그램 실행 화면

- 본 포스팅의 최종 완성된 프로그램의 결과화면은 아래와 같습니다.

1.프로그램을 실행하면 아래와 같이 동작 합니다.

먼저 gemini-pro-vision 모델에 의해 이미지 1장이 로드됩니다.

-이미지의 내용은 얼굴을 가린 키 차이가 제법 나는 여성 3명이 서있습니다.

2. 아래와 같이 제미나이에게 프롬프트(질의)를 하였더니

"사진을 보고 2번과 3번의 키를 cm 단위로 예상해줘"

제미나이가 첫번째 가장 큰 여성의 키를 확인하고, 나머지 2명의 여성의 키를 추측하여 알려주었습니다.

두번째 키가 큰 여성은 168Cm, 가장 작은 여성은 162Cm로 예상하였습니다.

3.아래는 원본 사진입니다.

실제로 두번째 키가 큰 여성은 164Cm, 가장 작은 여성은 154Cm로 예상과는 다소 차이 발생하였습니다.

추측해 보건데, 아직까지 제미나이AI의 사물간 거리, 공간 등을 측정하는 능력은 아주 뛰어나지는 않은 것 같습니다.

향후 얼마나 좋아질지 기대가 됩니다.

O 주요 내용

1. 소스코드를 살펴보면 다음과 같습니다.

이전글의 소스와 동일하며 하단의 프롬프트 부분만 다르므로 그 부분만 설명합니다.

-아래와 같은 형식(이미지를 주고 이미지속 객체의 크기 알아내기)으로 프롬프트를 작성할 수 있습니다.

이와 같이 작성하면 제미나이가 스스로 특정 이미지의 크기를 확인한 후 이미지속의 다른 객체를 비교/분석하여 크기/길이를 예상하여 알아 낼 수 있습니다.

다만, 현재까지 그 정확도는 다소 떨어지므로 이런 정도로만 이해하시면 되겠습니다.

ㅁ 정리

O 우리가 배운 내용

- 오늘은 구글의 제미나이 AI API를 이용하여 이미지속 객체를 보고 각 객체들의 크기를 예상하는 프롬프트 예시를 살펴보았습니다.

다음 글에서는 본 포스팅의 마지막 글로 특정 영상을 주고, 이 영상이 어떤 영상인지 설명하도록 하는 방법에 대해 살펴보겠습니다.

감사합니다.

좋은 내용의 글들이 계속 올려질 수 있도록 "공감" 버튼을 꾹 눌러주세요.

728x90

LIST

저작자표시 비영리 변경금지

'파이썬 AI 실습 > Gemini AI & Vertext AI API 사용 하기' 카테고리의 다른 글

Gemini AI & Vertext AI API 사용 하기 - 10.영상의 내용을 보고 어떤 영상인지 설명하기 (0)	2024.01.16
Gemini AI & Vertext AI API 사용 하기 - 8.전체 이미지 내용을 보고 특정 객체 찾아내기 (0)	2024.01.04
Gemini AI & Vertext AI API 사용 하기 - 7.이미지를 보고 스토리라인 만들기 (0)	2024.01.04
Gemini AI & Vertext AI API 사용 하기 - 6.이미지를 이해하고, 이미지속 객체를 json형태로 추출하기 (0)	2024.01.04
Gemini AI & Vertext AI API 사용 하기 - 5.이미지속 특정 객체의 가격 알아 맞추기 (0)	2024.01.04

현재글Gemini AI & Vertext AI API 사용 하기 - 9.이미지속 객체의 크기 예상하기

250x250

- 우리 블로그의 목표 '파이썬 기초부터 차근 차근' 배워 보는 파기차차 블로그로는 고수님들을 위한 곳이 아니며, 이제 막 시작하시려는 분들, 코딩 초보자분들을 위한 블로그입니다. 우리 블로그의 목표는 아래와 같습니다. 1. 쉬운 코딩이어야 한다. 2. 빠르게 할 수 있어야 한다. 3. 즉시 할 수 있어야 한다. 4. 어딘가 써먹을 수 있어야 한다. 우리는 이 블로그를 통해 단기간 쉽고, 빠르게 파이썬을 익혀 즉시, 어딘가 써먹을 것입니다.

k8s, FTP, ftp서버, 다운로드, Karlo, 초보, 쿠버네티스, ChatGPT, 셀레니움, 텔레그램, 파일전송, 크롤링, 구글클라우드플랫폼, 검색, 입문자, 파이썬, API, openai, gui, 윈도우,

Today :
Yesterday :

파기차차