파이썬 프로젝트 및 응용/chatGPT3.5로 자동으로 책 요약 후 아바타 숏츠만들기

[프로젝트]chatGPT3.5로 자동으로 책 요약 후 아바타 숏츠만들기 - 1.소개편

파기차차 2023. 4. 9. 07:46
728x90
반응형
SMALL

ㅁ 개요

 

O 프로그램 소개

 

 - 이번 프로그램은 chatGPT3.5 + 달리(텍스트를 이미지로 생성) + 미드져니(또 다른 이미지생성 AI, 디스코드 사용) + D-ID스튜디오의 말하는 아바타(이미지를 말하는 동영상으로 생성) + ffmpeg + movipy(동영상편집) 등 여러 기술들을 혼합+융합하여 책을 요약 후 말하는 아바타의 구글 숏츠를 만드는 방법을 설명합니다.

 

 

**본 포스팅 글은 아래 유튜브 사이트(국내 파이썬 최고 실력자 중 한 분)의 내용을 참고하여 작성하였으며, 초보자들이 좀 더 쉽고, 잘 따라할 수 있도록 해당 내용을 세부적으로 잘게 쪼개서 설명한 글입니다. 자세한 내용은 아래 사이트를 참고하여 주시기 바랍니다.

[GPT-4] 책 요약해서 유튜브 쇼츠 영상으로 돈버는 인공지능 만들기|빵형의 개발도상국

https://www.youtube.com/watch?v=_TVyF_4JJgk&t=814s

 

 

 

O 향후 진행 순서

 

이후 글부터 진행되는 세부적인 내용은 다음과 같습니다.

 

1.책 요약하기

-아직 chatGPT4를 사용하지 못하는 개발자의 경우 chatGPT3.5를 사용하여 책을 요약하는 방법을 알아 봅니다.

토큰 제약(4092개)으로 책을 페이지별로 끊어서 요약하고 리스트에 저장하는 방법을 살펴보겠습니다.

 

2.요약한 내용에 해당하는 이미지 만들기

-위의 1에서 요약한 내용을 OpenAI의 DALL.E로 이미지를 생성하는 방법에 대하여 살펴봅니다.

 

3.요약한 내용을 다시 60초 분량으로 줄이고, 한글로 번역하기(영상 한국어 스크립트 만들기)

-위의 1의 내용을 다시 60초 분량으로 요약하고, 영어로 요약된 문장을 한글로 번역하는 방법에 대하여 살펴봅니다.

 

4.이미지를 말하는 동영상으로 만들고 로컬(내 노트북 하드디스크)에 저장하기

4.1 디스코드에서 미드져니 AI를 이용하여 아바타 이미지를 생성하는 방법에 대하여 소개합니다.

4.2 D-ID 스튜디오에서 API를 이용하여 4-1에서 만든 이미지를 말하는 동영상으로 다시 만든 후 내 로컬 디스크에 동영상을 저장하는 방법을 알아 봅니다.

 

5.ffmpeg로 영상을 작게 만들기

-ffmpeg를 사용하여 mp4 영상을 작게 만드는 방법을 알아봅니다.

 

6.백그라운드 음악과 이미지를 입히고, 아바타를 작게 만들어 오른쪽 아래에 위치시키기

-마지막으로 백그라운드 음악을 원본영상에 삽입하고, 이미지를 배경에 넣는 방법과 위의 5에서 만는 작은 영상(아바타)을 오른쪽 하단에 위치시켜 최종 영상을 만드는 방법에 대하여 알아봅니다.

 

 

 

 

O 완성된 프로그램 실행 화면

 - 최종 완성된 프로그램의 결과화면은 아래와 같습니다.

 

 

1. 프로그램 실행전 아래와 같이 2가지를 준비합니다.(책과 배경음악)

아래에서 무료로 다운로드 가능합니다.

 

-무료 책(pdf) 다운로드 사이트를 발견하였으나, 기록을 하지 않아 어디인지 현재 알 수 없어 아래 몇개 파일을 업로드 합니다.(학습 용도로만 사용해 주시기 바랍니다.)

EfficientNet.pdf
0.89MB
10. Family Cares author W.W Jacobs .pdf
0.09MB
04. Village in India Myths and Realities author Vishwa Anand.pdf
0.04MB
12. The Gold Bug author Edgar Allan Poe.pdf
0.15MB

   

 

-무료 배경음악 다운로드 사이트(혹시 모르니 저작권을 확인하시고 사용하시기 바랍니다.)

https://pixabay.com/ko/music/search/genre/%EC%9E%A5%EB%A9%B4%EC%9D%84%20%EC%8C%93%EB%8B%A4/

 

 

2. 아래는 책 2권과 배경음악 2개의 이름을 변경 후 'paper list' 와 'bgm_list' 폴더에 넣었습니다.

 

 

 

 

3. '001.pdf'파일은 5페이지 분량의 첫번째 책입니다.

 

 

 

 

 

4. 프로그램을 실행하면 아래와 같이 실행됩니다.

2) 책 내용을 요약합니다.

 

3)요약한 내용에 해당하는 이미지 만들고 4)요약내용을 다시 60초 분량으로 줄이고, 한글로 번역 합니다.

 

 

5) 이미지를 말하는 동영상으로 만든 후 로컬 디스크에 저장하고, 6) ffmpeg로 영상을 작게 만들고, 백그라운드 음악과 이미지 배경을 만든 후 아바타를 작게 만들어 오른쪽 아래에 위치시킵니다.

 

5. for 루프로 2번째 영상(숏츠)을 만들고 있습니다.

 

 

 

 

2번째 영상이 잘 만들어 졌습니다.

 

 

 

6.프로그램 실행이 완료되면 아래와 같이 배경음악에 아바타 소리가 합성된 파일(imsi~.m4a)이 생성되며,

 

7.images 폴더 2개가 생성됩니다.(for루프를 2번 돌았으므로)

 

 

8. 확인해 보니 달리에 의해 만들어진 이미지가 이미지폴더마다 생성되어 있는 것을 볼 수 있습니다.

 

 

9. 그리고 video_list 폴더가 생성되어 있으며,

 

 

 

10. 폴더 확인결과 아바타 영상이 포함되어 있습니다.(원본영상 2개 + 170 사이즈영상 2개)

 

11. 원본영상을 실행한 결과 잘 실행 되며, 책요약을 잘 설명해 주고 있습니다.

 

12. 마지막으로 최종 파일이 2개 생성된 것을 알 수 있습니다.

(result~.mp4)

 

 

13. 최종파일 실행결과 책 내용을 요약하여 아바타가 오른쪽 아래에 위치하여 잘 설명해 주고 있는 것을 확인하였습니다.

 

 

 

 

이후 글부터 위의 '향후 진행 순서'에서 말씀 드린 내용대로 하나씩 자세해 설명 드리겠습니다.

 

오늘은 여기까지이며, 위의 내용이 유익하셨다면, 좋아요와 구독 부탁드립니다.

 

 

감사합니다.

 

 

 

※ 추가적인 정보는 아래 유튜브 영상에서 해당 내용을 더욱 자세히 보실 수 있습니다.

 

 

728x90
반응형
LIST