좋은 내용의 글들이 계속 올려질 수 있도록 "공감" 버튼을 꾹 눌러주세요.
ㅁ 개요
O 프로그램 소개
- 이번 글은 이전글(2023.12.25 - [분류 전체보기] - Gemini AI & Vertext AI API 사용 하기 - 8.전체 이미지 내용을 보고 특정 객체 찾아내기)에 이은 9번째 글로 이미지속 객체를 보고 각 객체들의 크기를 예상하는 프롬프트 예시를 살펴보겠습니다.
O 준비 사항
-프로그램이 정상적으로 실행되기 위해서는 아래 이미지가 필요합니다.
아래 이미지파일을 다운로드하여 img폴더 아래에 위치시켜 주시기 바랍니다.
O 완성된 프로그램 실행 화면
1.프로그램을 실행하면 아래와 같이 동작 합니다.
먼저 gemini-pro-vision 모델에 의해 이미지 1장이 로드됩니다.
-이미지의 내용은 얼굴을 가린 키 차이가 제법 나는 여성 3명이 서있습니다.
2. 아래와 같이 제미나이에게 프롬프트(질의)를 하였더니
"사진을 보고 2번과 3번의 키를 cm 단위로 예상해줘"
제미나이가 첫번째 가장 큰 여성의 키를 확인하고, 나머지 2명의 여성의 키를 추측하여 알려주었습니다.
두번째 키가 큰 여성은 168Cm, 가장 작은 여성은 162Cm로 예상하였습니다.
3.아래는 원본 사진입니다.
실제로 두번째 키가 큰 여성은 164Cm, 가장 작은 여성은 154Cm로 예상과는 다소 차이 발생하였습니다.
추측해 보건데, 아직까지 제미나이AI의 사물간 거리, 공간 등을 측정하는 능력은 아주 뛰어나지는 않은 것 같습니다.
향후 얼마나 좋아질지 기대가 됩니다.
O 주요 내용
1. 소스코드를 살펴보면 다음과 같습니다.
이전글의 소스와 동일하며 하단의 프롬프트 부분만 다르므로 그 부분만 설명합니다.
-아래와 같은 형식(이미지를 주고 이미지속 객체의 크기 알아내기)으로 프롬프트를 작성할 수 있습니다.
이와 같이 작성하면 제미나이가 스스로 특정 이미지의 크기를 확인한 후 이미지속의 다른 객체를 비교/분석하여 크기/길이를 예상하여 알아 낼 수 있습니다.
다만, 현재까지 그 정확도는 다소 떨어지므로 이런 정도로만 이해하시면 되겠습니다.
ㅁ 정리
O 우리가 배운 내용
다음 글에서는 본 포스팅의 마지막 글로 특정 영상을 주고, 이 영상이 어떤 영상인지 설명하도록 하는 방법에 대해 살펴보겠습니다.
감사합니다.
좋은 내용의 글들이 계속 올려질 수 있도록 "공감" 버튼을 꾹 눌러주세요.
'파이썬 AI 실습 > Gemini AI & Vertext AI API 사용 하기' 카테고리의 다른 글
Gemini AI & Vertext AI API 사용 하기 - 10.영상의 내용을 보고 어떤 영상인지 설명하기 (0) | 2024.01.16 |
---|---|
Gemini AI & Vertext AI API 사용 하기 - 8.전체 이미지 내용을 보고 특정 객체 찾아내기 (0) | 2024.01.04 |
Gemini AI & Vertext AI API 사용 하기 - 7.이미지를 보고 스토리라인 만들기 (0) | 2024.01.04 |
Gemini AI & Vertext AI API 사용 하기 - 6.이미지를 이해하고, 이미지속 객체를 json형태로 추출하기 (0) | 2024.01.04 |
Gemini AI & Vertext AI API 사용 하기 - 5.이미지속 특정 객체의 가격 알아 맞추기 (0) | 2024.01.04 |