728x90
반응형
SMALL

퀵포스팅 16

60분 오디오 1초만에 요약하기

ㅁ 개요 O 프로그램 소개 - 이번 내용은 5월 6일 올라온 아래 기사와 같이 엔비디아에서 공개한 오픈소스 모델을 사용하여 60분짜리 오디오가 1초만에 스크립트로 만들어지는지 확인해 보도록 하겠습니다. 결론 : 파일 사이즈, 운영 환경에 따라 다 다르겠지만, 17분짜리 wav파일 음성 50MB로 실제 해본 결과 1초는 어렵고요, 약 10초 정도소요됩니다. 그래도 어마 무시하게 빠른 건 맞는것 같습니다. 1.테스트 방법 1. 아래 사이트에 접속합니다.(먼저 허깅페이스에 로그인 하셔야 합니다.)https://huggingface.co/spaces/nvidia/parakeet-tdt-0.6b-v2 테스트 음성파일 : 필요하신 분은 아래에서 다운로드 하시기 바랍니다.https://dri..

퀵포스팅/기타 2025.05.18

유료 사이트 기사 보는 방법

ㅁ 개요 O 프로그램 소개 - 이번 내용은 간단하게 AI챗봇을 이용하여 유로 사이트의 기사를 보는 방법을 알아보겠습니다. 1.사용방법 사실 너무 간단하여 사용방법이랄것 까지도 없습니다. 그냥 AI챗봇에서 아래와 같이 하시면 됩니다. 예)chatGPT----------------------------------------------------------------------------------------https://www.businessinsider.com/google-deepmind-ceo-advice-college-students-ai-change-2025-5위 기사 내용 요약해줘---------------------------------------------------------..

퀵포스팅/기타 2025.05.18

지극히 개인적인 현시점(2025.05.10) 무료 AI챗봇 순위 정리

**새로 업데이트한 내용은 주황색등의 색상으로 표시 됩니다.ㅁ 무료 AI챗봇 순위지극히 개인적인 현시점 AI챗봇의 순위를 매겨봅니다.주관적인 관점이므로 그냥 참고만 해주시기 바랍니다. **판단 기준(우선순위는 아래 순서대로임)1.실시간 정보 수집이 가능한지>너무 예전 정보로 대답하지 않는지, 현재 시점 기준의 정보를 제시할 수 있는지2.정보의 질의 좋은지>너무 성의 없이 대답하지 않는지, 답변의 정확도가 높은지, 출처를 제시하는지3.인터페이스가 좋은지>응답 결과가 한눈에 보기가 편한지4.응답 속도>응답 속도가 너무 느리지 않은지5.한글 지원이 되는지>요청시 응답결과로 한글로 보여줄 수 있는지 **AI 챗봇 순위>1~5점으로 점수 부여(1이 낮은 점수, 5가 높은 점수)>시점에 따라 순위는 계속 바뀔 ..

구글 노트북LM 초간단 사용해 보기

ㅁ 개요 O 프로그램 소개  - 이번 내용은 나온지는 좀 되었으나, 그 기능의 활용성이 꽤 좋다고 생각하여 주요 기능에 대하여 사용방법을 알아보겠습니다.   O 진행 순서 진행 순서는 크게 아래와 같이 주요기능 순으로 설명합니다. 1.핵심 내용 요약하기 -구글 노트북LM에서 가장 사용할 만한 것은 1000페이지 짜리 책을 단 1페이지로 몇 초(?)만에 요약/정리가 가능하다는 것이며, AI챗봇은 사이즈 제한과 몇 번 사용하면 유료로 전환해야 하는 반면 이 노트북은 무료로 대량의 업로드가 가능하다는 것이 큰 장점입니다.>업로드 크기 제한 : 200MB, 500,000 단어까지 가능>업로드 타입 : pdf, 유튜브 영상, 오디오 파일, txt 등예) '첨부의 소스파일 전체 내용 핵심만 요약 해줘' 2.업로드한..

Gemini 2.0 Flash(image Generation) Experimental의 새로운 기능들

ㅁ 개요 O 프로그램 소개  - 이번 내용은 최근(2025.03.15~) 나온 따끈 따끈한 구글 제미나이 2.0 Flash의 새로운 기능들을 간단하게 사용하는 방법에 대해 알아보겠습니다.   O 진행 순서 진행 순서는 크게 아래와 같습니다. 1.Gemini Deep Research -오픈AI의 딥리서치 기능과 유사하게 구글 제미나이 딥리서치 기능이 출시되었습니다. 간단하게 사용하는 법에 대해 살펴보겠습니다.  2.유튜브 방송 요약 -Gemini 2.0 Flash의 새로운 기능으로 유튜브 방송의 내용을 몇 줄로 요약, 정리해 주는 기능이 출시되었으며, 이 부분도 간단히 살펴보겠습니다.  3.이미지 편집 - -Gemini 2.0 Flash(image Generation) Experimental 가 새로운 이..

제미나이 2.0 ai api로 할 수 있는 것들 - 8.오디오 분석하기

1. 아래와 같이 코딩 후 실행합니다.import google.generativeai as genaifrom config import *genai.configure(api_key=API_KEY)myfile = genai.upload_file("output.mp3")print(f"{myfile=}")model = genai.GenerativeModel("gemini-1.5-flash")result = model.generate_content([myfile, "오디오 파일의 주요 내용에 대해 설명해줘"])print(f"{result.text=}")# 참고# https://ai.google.dev/gemini-api/docs/audio?hl=ko&_gl=1*1ybgrt1*_up*MQ..*_ga*MTIzODAy..

제미나이 2.0 ai api로 할 수 있는 것들 - 7.AI Studio api의 다양한 모델들

1. 아래와 같이 코딩 후 실행합니다.>아래 주석을 풀고 다양한 모델을 테스트해 볼 수 있습니다.import google.generativeai as genaifrom config import *genai.configure(api_key=API_KEY)# model = genai.GenerativeModel("gemini-1.5-flash")# model = genai.GenerativeModel("gemini-2.0-flash-exp")# model = genai.GenerativeModel("learnlm-1.5-pro-experimental")model = genai.GenerativeModel("gemini-exp-1114")# model = genai.GenerativeModel("gemini-..

제미나이 2.0 ai api로 할 수 있는 것들 - 6.텍스트 감정 분석

1. 아래와 같이 코딩 후 실행합니다.>아래 주석(while문)을 풀고 실행시 마이크에 대고 한국어로 얘기하면 실시간으로 감정분석 결과를 얻을 수 있습니다.import google.generativeai as genaiimport speech_recognition as srfrom config import *genai.configure(api_key=API_KEY)# model = genai.GenerativeModel("gemini-1.5-flash")model = genai.GenerativeModel("gemini-2.0-flash-exp")response = model.generate_content("Explain how AI works")def analyze_emotion(text): pr..

제미나이 2.0 ai api로 할 수 있는 것들 - 5.실시간 번역

1. 아래와 같이 코딩 후 실행합니다.>아래 주석(while문)을 풀고 실행시 마이크에 대고 한국어로 얘기할 수 있습니다. import google.generativeai as genaiimport speech_recognition as srfrom gtts import gTTSimport osfrom config import *genai.configure(api_key=API_KEY)# model = genai.GenerativeModel("gemini-1.5-flash")model = genai.GenerativeModel("gemini-2.0-flash-exp")def translate_text(text, target_language): response = model.generate_conte..

728x90
반응형
LIST