ㅁ 개요
O 프로젝트 소개
- 이번 프로젝트는 파이썬+허깅페이스+구글colab+메타 라마2(또는 라마3)를 이용하여 파인튜닝하는 방법을 알아보겠습니다.
여기서 얘기하는 파인튜닝이란 챗지피티의 'GPT 탐색'에서 볼 수 있는 전문가GPT와 비슷한 것으로 예를 들어 중학교 1학년 교재를 모델에 학습시킨 후 중학교 1학년 수학전문가 AI챗봇 만들고, 이 챗봇에 중1 수학문제를 물어보면 챗봇이 풀어서 답변해 주는 것이라고 생각하면 되겠습니다.
O 사전 준비 사항
우리는 구글 colab을 사용하여 작업할 것이기 때문에 구글계정이 필요합니다. 없으신 분들은 구글계정을 만들어 두시기 바랍니다.
구글 colab은 집의 PC 및 노트북에서 구동할 수 없는 고사양이 필요한 모델 튜닝 등의 작업을 손쉽게 할 수 있으므로 몇가지 제약이 있지만, 활용하기 좋은 솔루션이기 때문에 금번 실습을 위해 사용하게 되었습니다.
우리는 실습을 위해 아래 2가지가 사전 준비되어야 하며, 아래 단계별 진행 시 함께 다뤄보도록 하겠습니다.
1.구글 colab 준비
2.허깅페이스 엑세스토큰 및 모델 사용을 위한 사전동의
O 진행 순서
진행 순서는 크게 아래와 같습니다.
1.구글 colab 준비하기
-구글 계정만 있으면 구글 colab을 사용할 수 있습니다. 물론 유료 사용자는 자원을 독점적으로 사용할 수 있고, 다양한 혜택이 존재하나, 우리는 무료 계정을 이용하여 최대한 활용해 보도록 하겠습니다.
2.허깅페이스 준비하기
-우리는 허깅페이스에 오픈된 AI모델 중 하나인 라마2를 사용할 예정입니다. 이를 사용하기 위해서는 2가지가 필요합니다. 첫번째는 허깅페이스에 접근할 수 있는 엑세스토큰(로그인 인증과 유사하다고 보시면 됩니다.)이 필요하며, 두번째는 모델사용을 위한 동의 후 허용승인을 받아야 모델을 사용할 수 있습니다.
(*라마3.1을 사용하셔도 되며, 사용 동의 후 허용승인이 나기까지 시간이 오려걸려 저는 그냥 라마2로 하였습니다.)
우리는 허깅페이스에서 위의 2가지를 준비하는 방법에 대해 알아 보도록 하겠습니다.
3. colab에서 모델 튜닝 및 다운로드하기
- 집의 PC나 노트북으로는 모델 튜닝이 거의 불가능합니다. 엄청난 고사양의 자원이 필요한데, 이것을 하자고 거금을 들일 수는 없으니까요. 다행히 colab을 사용하면 이런 작업이 가능하며, 우리는 여기서 기본모델+추가기능 형태로 우리가 원하는 기능을 모델에 추가하고 다운로드하는 방법에 대해 알아볼 것입니다.
4. 다운로드한 튜닝 모델파일 사용하기
-위의 3번에 다운로드한 튜닝 모델을 사용하여 파이썬으로 ai챗봇을 만드는 방법에 대하여 알아보겠습니다.
이를 응용하면 우리는 기업에서도 기업 내부자료의 유출을 걱정할 필요없이 폐쇄망(인터넷X)에서도 AI챗봇을 사용할 수 있게 되어 업무 효율성을 크게 높일 수 있을 것입니다.
5. colab에서 튜닝된 모델 사용해 보기
-위의 4번을 하려면 PC나 노트북의 성능이 엄청 좋아야만 가능합니다. 하지만 실제 로컬에서 구동하기에는 많은 제약이 따르므로 로컬에서 실행하실 수 없는 분들을 위해 구글 colab에서 튜닝된 모델을 사용하는 방법에 대해 알아보겠습니다.
위의 내용이 유익하셨다면, 광고 한번씩만 클릭 부탁드립니다.
감사합니다.
'파이썬 AI 실습 > 메타의 라마(llama) 파인튜닝(전문가GPT) 하기' 카테고리의 다른 글
메타의 라마(llama) 파인튜닝(전문가GPT) 하기 - 5. colab에서 튜닝된 모델 사용해 보기 (0) | 2024.08.18 |
---|---|
메타의 라마(llama) 파인튜닝(전문가GPT) 하기 - 4. 다운로드한 튜닝 모델파일 사용하기 (0) | 2024.08.18 |
메타의 라마(llama) 파인튜닝(전문가GPT) 하기 - 3. colab에서 모델 튜닝 및 다운로드하기 (0) | 2024.08.18 |
메타의 라마(llama) 파인튜닝(전문가GPT) 하기 - 2.허깅페이스 준비하기 (0) | 2024.08.18 |
메타의 라마(llama) 파인튜닝(전문가GPT) 하기 - 1.구글 colab 준비하기 (0) | 2024.08.18 |