파이썬 AI 실습/메타의 라마(llama) 파인튜닝(전문가GPT) 하기

메타의 라마(llama) 파인튜닝(전문가GPT) 하기 - 0.소개

파기차차 2024. 8. 18. 16:25
728x90
반응형
SMALL

ㅁ 개요

 

O 프로젝트 소개

 

 - 이번 프로젝트는 파이썬+허깅페이스+구글colab+메타 라마2(또는 라마3)를 이용하여 파인튜닝하는 방법을 알아보겠습니다.

여기서 얘기하는 파인튜닝이란 챗지피티의 'GPT 탐색'에서 볼 수 있는 전문가GPT와 비슷한 것으로 예를 들어 중학교 1학년 교재를 모델에 학습시킨 후 중학교 1학년 수학전문가 AI챗봇 만들고, 이 챗봇에 중1 수학문제를 물어보면 챗봇이 풀어서 답변해 주는 것이라고 생각하면 되겠습니다.

 

 

 

 

O 사전 준비 사항

우리는 구글 colab을 사용하여 작업할 것이기 때문에 구글계정이 필요합니다. 없으신 분들은 구글계정을 만들어 두시기 바랍니다.

 

구글 colab은 집의 PC 및 노트북에서 구동할 수 없는 고사양이 필요한 모델 튜닝 등의 작업을 손쉽게 할 수 있으므로 몇가지 제약이 있지만, 활용하기 좋은 솔루션이기 때문에 금번 실습을 위해 사용하게 되었습니다.

 

우리는 실습을 위해 아래 2가지가 사전 준비되어야 하며, 아래 단계별 진행 시 함께 다뤄보도록 하겠습니다.

 

1.구글 colab 준비

2.허깅페이스 엑세스토큰 및 모델 사용을 위한 사전동의

 

 

O 진행 순서

 

진행 순서는 크게 아래와 같습니다.

 

1.구글 colab 준비하기

 -구글 계정만 있으면 구글 colab을 사용할 수 있습니다. 물론 유료 사용자는 자원을 독점적으로 사용할 수 있고, 다양한 혜택이 존재하나, 우리는 무료 계정을 이용하여 최대한 활용해 보도록 하겠습니다.

 

 

2.허깅페이스 준비하기

 -우리는 허깅페이스에 오픈된 AI모델 중 하나인 라마2를 사용할 예정입니다. 이를 사용하기 위해서는 2가지가 필요합니다. 첫번째는 허깅페이스에 접근할 수 있는 엑세스토큰(로그인 인증과 유사하다고 보시면 됩니다.)이 필요하며, 두번째는 모델사용을 위한 동의 후 허용승인을 받아야 모델을 사용할 수 있습니다.

(*라마3.1을 사용하셔도 되며, 사용 동의 후 허용승인이 나기까지 시간이 오려걸려 저는 그냥 라마2로 하였습니다.)

우리는 허깅페이스에서 위의 2가지를 준비하는 방법에 대해 알아 보도록 하겠습니다.

 

 

3. colab에서 모델 튜닝 및 다운로드하기

 - 집의 PC나 노트북으로는 모델 튜닝이 거의 불가능합니다. 엄청난 고사양의 자원이 필요한데, 이것을 하자고 거금을 들일 수는 없으니까요. 다행히 colab을 사용하면 이런 작업이 가능하며, 우리는 여기서 기본모델+추가기능 형태로 우리가 원하는 기능을 모델에 추가하고 다운로드하는 방법에 대해 알아볼 것입니다.

 

 

4. 다운로드한 튜닝 모델파일 사용하기

 -위의 3번에 다운로드한 튜닝 모델을 사용하여 파이썬으로 ai챗봇을 만드는 방법에 대하여 알아보겠습니다.

이를 응용하면 우리는 기업에서도 기업 내부자료의 유출을 걱정할 필요없이 폐쇄망(인터넷X)에서도 AI챗봇을 사용할 수 있게 되어 업무 효율성을 크게 높일 수 있을 것입니다.

 

 

5. colab에서 튜닝된 모델 사용해 보기

 -위의 4번을 하려면 PC나 노트북의 성능이 엄청 좋아야만 가능합니다. 하지만 실제 로컬에서 구동하기에는 많은 제약이 따르므로 로컬에서 실행하실 수 없는 분들을 위해 구글 colab에서 튜닝된 모델을 사용하는 방법에 대해 알아보겠습니다.

 

 

 

 

다음 글부터 위에서 말씀드린 진행순서에 따라 메타의 라마2를 기준으로 파인튜닝하는 방법을 하나씩 자세히 설명 드리겠습니다.
 

 

위의 내용이 유익하셨다면, 광고 한번씩만 클릭 부탁드립니다.

 

 

 

 

감사합니다.

728x90
반응형
LIST