제미나이 2.0 ai api로 할 수 있는 것들 - 2.이미지에 대한 설명 얻기

퀵포스팅/제미나이2.0 ai api로 할 수 있는 것들

제미나이 2.0 ai api로 할 수 있는 것들 - 2.이미지에 대한 설명 얻기

파기차차 2024. 12. 22. 11:01

728x90

SMALL

1. 아래와 같이 코딩합니다.

##############################
## 이미지 기반 질의 응답 수행 ##
##############################


import google.generativeai as genai
from PIL import Image
from config import *

# Step 1: Gemini API 키 설정
genai.configure(api_key=API_KEY)

# Step 2: 이미지와 질문 입력
def image_based_qna(image_path, question):
    """
    Gemini 2.0 Flash API를 통해 이미지 기반 질의응답 수행
    :param image_path: 분석할 이미지 파일 경로
    :param question: 이미지와 관련된 질문
    :return: Gemini의 답변
    """
    try:
        # 이미지 로드
        image = Image.open(image_path)
        
        # Gemini 모델 로드
        model = genai.GenerativeModel("gemini-1.5-flash")
        
        # 이미지와 질문을 함께 전달
        response = model.generate_content([question, image])
        
        # 응답 반환
        return response.text
    
    except Exception as e:
        return f"오류 발생: {e}"

# Step 3: 실행 예시
if __name__ == "__main__":
    # 이미지 파일 경로와 질문 입력
    image_path = "cat2.png"  # 분석할 이미지 파일 경로
    question = "이 사진에 나오는 고양이의 품종은 무엇인가요?"

    # 질의응답 실행
    answer = image_based_qna(image_path, question)
    print("Gemini의 답변:", answer)

2.아래와 같이 응답결과를 얻을 수 있습니다.

3.참고로 cat2.png 이미지는 다음과 같습니다.

4. 아래와 같이 코딩합니다.(이미지 설명해줘)

import google.generativeai as genai
import PIL.Image
from config import *

genai.configure(api_key=API_KEY)

model = genai.GenerativeModel("gemini-1.5-flash")
organ = PIL.Image.open("cat.jpg")
response = model.generate_content(["첨부안 이미지에 대해 설명해줘", organ])
print(response.text)

5.아래와 같이 응답결과를 얻을 수 있습니다.

6.아래와 같이 코딩하면 url 기반으로 인터넷의 이미지에 대해 분석을 요청할 수 있습니다.

import httpx
import os
import base64
import google.generativeai as genai
from config import *

genai.configure(api_key=API_KEY)

model = genai.GenerativeModel(model_name = "gemini-1.5-pro")
image_path = "https://upload.wikimedia.org/wikipedia/commons/thumb/8/87/Palace_of_Westminster_from_the_dome_on_Methodist_Central_Hall.jpg/2560px-Palace_of_Westminster_from_the_dome_on_Methodist_Central_Hall.jpg"

image = httpx.get(image_path)

prompt = "이 이미지의 제목 달아줘"
response = model.generate_content([{'mime_type':'image/jpeg', 'data': base64.b64encode(image.content).decode('utf-8')}, prompt])

print(response.text)

7. 실행결과는 아래와 같습니다.

8.아래와 같이 코딩하면 url 기반으로 여러개의 인터넷의 이미지에 대해 분석을 요청할 수 있습니다.

import httpx
import os
import base64

import google.generativeai as genai
from config import *

genai.configure(api_key=API_KEY)

model = genai.GenerativeModel(model_name = "gemini-1.5-pro")
image_path_1 = "https://blog.malcang.com/wp-content/uploads/2024/03/1-1.png"  # Replace with the actual path to your first image
image_path_2 = "http://image.dongascience.com/Photo/2020/03/5bddba7b6574b95d37b6079c199d7101.jpg" # Replace with the actual path to your second image

image_1 = httpx.get(image_path_1)
image_2 = httpx.get(image_path_2)

prompt = "두 이미지에 포함된 내용을 비교해서 설명해줘"

response = model.generate_content([
{'mime_type':'image/jpeg', 'data': base64.b64encode(image_1.content).decode('utf-8')},
{'mime_type':'image/jpeg', 'data': base64.b64encode(image_2.content).decode('utf-8')}, prompt])

print(response.text)

9. 실행결과는 아래와 같습니다.

728x90

LIST

저작자표시 비영리 변경금지 (새창열림)

'퀵포스팅 > 제미나이2.0 ai api로 할 수 있는 것들' 카테고리의 다른 글

제미나이 2.0 ai api로 할 수 있는 것들 - 5.실시간 번역 (0)	2024.12.22
제미나이 2.0 ai api로 할 수 있는 것들 - 4.여행계획 짜기 (3)	2024.12.22
제미나이 2.0 ai api로 할 수 있는 것들 - 3.동영상에 대한 설명 얻기 (1)	2024.12.22
제미나이 2.0 ai api로 할 수 있는 것들 - 1.기본 API 사용법 (0)	2024.12.22
제미나이 2.0 ai api로 할 수 있는 것들 - 0.소개, 특징 (1)	2024.12.22

현재글제미나이 2.0 ai api로 할 수 있는 것들 - 2.이미지에 대한 설명 얻기

파기차차 - 우리 블로그의 목표 '파이썬 기초부터 차근 차근' 배워 보는 파기차차 블로그로는 고수님들을 위한 곳이 아니며, 이제 막 시작하시려는 분들, 코딩 초보자분들을 위한 블로그입니다. 우리 블로그의 목표는 아래와 같습니다. 1. 쉬운 코딩이어야 한다. 2. 빠르게 할 수 있어야 한다. 3. 즉시 할 수 있어야 한다. 4. 어딘가 써먹을 수 있어야 한다. 우리는 이 블로그를 통해 단기간 쉽고, 빠르게 파이썬을 익혀 즉시, 어딘가 써먹을 것입니다.

250x250

- 우리 블로그의 목표 '파이썬 기초부터 차근 차근' 배워 보는 파기차차 블로그로는 고수님들을 위한 곳이 아니며, 이제 막 시작하시려는 분들, 코딩 초보자분들을 위한 블로그입니다. 우리 블로그의 목표는 아래와 같습니다. 1. 쉬운 코딩이어야 한다. 2. 빠르게 할 수 있어야 한다. 3. 즉시 할 수 있어야 한다. 4. 어딘가 써먹을 수 있어야 한다. 우리는 이 블로그를 통해 단기간 쉽고, 빠르게 파이썬을 익혀 즉시, 어딘가 써먹을 것입니다.

텔레그램, 다운로드, 초보, FTP, ChatGPT, ftp서버, gui, openai, 파이썬, 입문자, API, 구글클라우드플랫폼, 크롤링, 파일전송, 셀레니움, k8s, 윈도우, 검색, 쿠버네티스, Karlo,

Today :
Yesterday :

일	월	화	수	목	금	토
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

내 블로그 - 관리자 홈 전환	`Q` `Q`
새 글 쓰기	`W` `W`

글 수정 (권한 있는 경우)	`E` `E`
댓글 영역으로 이동	`C` `C`

이 페이지의 URL 복사	`S` `S`
맨 위로 이동	`T` `T`
티스토리 홈 이동	`H` `H`
단축키 안내	`Shift` + `/` `⇧` + `/`

파기차차