파이썬 강좌(초급)/(실습) 크롤링

(실습)파이썬 네이버에서 강아지로 검색 후 강아지 이미지를 자동으로 크롤링 하는 프로그램 만들기 - 8.PC에 다운로드한 이미지를 저장하기

파기차차 2024. 3. 3. 13:54
728x90
반응형
SMALL

ㅁ 개요

 

O 프로그램 소개

 

 

 - 이번 글은 이전글((실습)파이썬 네이버에서 강아지로 검색 후 강아지 이미지를 자동으로 크롤링 하는 프로그램 만들기 - 7.이미지를 다운로드하고, 이미지 파일이름 만들기)에 이은 9번째 마지막글로 다운로드한 이미지를 저장하는 방법에 대해 설명합니다.

 

 

 

 

 

O 완성된 프로그램 실행 화면

 

 

 - 최종 완성된 프로그램의 결과화면은 아래와 같습니다.

 

 

1.소스코드를 실행하면 아래와 같이 나타납니다.

 

(1) 파일이름을 출력하고 이미지가 잘 되장되었음을 알리는 메시지를 보여줍니다.

 

(2) 실제 실행 폴더에 가서 확인 결과 해당 이미지가 파일로 잘 저장된 것을 볼 수 있습니다.

 


 

ㅁ 세부 내용

 

O 완성된 소스

 

 

소스 : 8.crawing_naver.py

 

 

 

O 소스 실행

 
 - 소스파일 다운로드 후 cmd, 파워쉘 또는 vscode 등에서 아래와 같이 실행하시기 바랍니다.
 
 > python 8.crawing_naver .py

 

 


 

O 주요 내용

 

 

아래 소스에 대해 간략히 설명하면 다음과 같습니다.

 

line 87 : filename을 쓰기모드로 열고,

line 88 : 이미지를 저장합니다.

 

 

 


 

ㅁ 정리

 

O 우리가 배운 내용

 
 - 오늘 우리는 다운로드한 이미지를 저장하는 방법에 대해 알아보았습니다.

 

 - 오늘 우리가 배운 내용 중 가장 중요한 부분을 꼽으라면 아래와 같습니다.

파일을 쓰기모드로 열고, 이미지 파일을 저정합니다.

    with open(filename, 'wb') as f:
        f.write(img_data)

 

 

- 이것으로 '(실습)파이썬 네이버에서 강아지로 검색 후 강아지 이미지를 자동으로 크롤링 하는 프로그램 만들기'의 기본학습을 모두 마칩니다.

 

 

 

- 하지만 기본학습 프로그램의 경우 아래 개선이 필요한 내용이 있습니다. 이후 '추가 학습' 편에서는 이러한 문제점을 개선한 추가 내용에 대해 학습하도록 하겠습니다.

 

**개선사항

9.인코딩된 이미지를 어떻게 다운로드하여 저장할 것인지
10.파일로 저장시 파일이름에 특수문자가 포함된 경우의 처리를 어떻게 할 것인지
11.이미지 저장시 현재폴더가 아닌 별도 폴더 생성 후 해당 폴더에 어떻게 저장할 것인지
12.폴더 이름을 현재시간을 사용해서 만들려면 어떻게 하면 되는지
>예: img_20240301_113242
13.많은 이미지를 받을 경우 페이지를 내린 후 받아야 하는데 이를 어떻게 해결할 것인가?

 
 
 
 

 

오늘은 여기까지이며, 댓글하트는 제가 이글을 지속할 수 있게 해주는 힘이 됩니다.

 

 

감사합니다.

728x90
반응형
LIST