(실습)파이썬 네이버에서 강아지로 검색 후 강아지 이미지를 자동으로 크롤링 하는 프로그램 만들기

파이썬 강좌(초급)/(실습) 크롤링

(실습)파이썬 네이버에서 강아지로 검색 후 강아지 이미지를 자동으로 크롤링 하는 프로그램 만들기 - 3.네이버 검색 페이지에서 모든 소스 가져오기

파기차차 2024. 3. 3. 13:52

728x90

SMALL

ㅁ 개요

O 프로그램 소개

- 이번 글은 이전글( (실습)파이썬 네이버에서 강아지로 검색 후 강아지 이미지를 자동으로 크롤링 하는 프로그램 만들기 - 2.네이버 검색 페이지 로딩하기)에 이은 4번째 글로 BeautifulSoup로 가져온 데이터 중에서 '강아지' 이미지 태그 부분만 가져오도록 필터링하는 방법에 대해 알아 보겠습니다.

O 완성된 프로그램 실행 화면

- 최종 완성된 프로그램의 결과화면은 아래와 같습니다.

1.소스코드를 실행하면 아래와 같이 검색결과를 가져와서 보여줍니다.

첫번째 보여주는 것은 html 그대로의 소스입니다.

두번째 보여주는 것은 html 소스를 파싱해서 결과를 보여줍니다.

ㅁ 세부 내용

O 완성된 소스

소스 : 3.crawing_naver.py

O 소스 실행

- 소스파일 다운로드 후 cmd, 파워쉘 또는 vscode 등에서 아래와 같이 실행하시기 바랍니다.

> python 3.crawing_naver .py

O 주요 내용

아래 소스에 대해 간략히 설명하면 다음과 같습니다.

line 32~33 : 이전 시간에 만든 browser객체로 페이지소스를 가져와서 화면에 뿌려줍니다.

line 34~35: 위의 페이지소스를 html.parser로 파싱 후 soup변수에 담아서 다시 화면에 출력합니다.

파싱하는 경우 날 html소스보다 보기 좋게된 형태로 가져옵니다.

ㅁ 정리

O 우리가 배운 내용

- 오늘 우리는 BeautifulSoup로 가져온 데이터 중에서 '강아지' 이미지 태그 부분만 가져오도록 필터링하는 방법에 대해 알아 보았습니다.

- 오늘 우리가 배운 내용 중 가장 중요한 부분을 꼽으라면 아래와 같습니다.

브라우저 객체로 페이지 소스를 가져오고, 이를 다시 BeautifulSoup객체의 html.parser로 파싱하여 가져옵니다.

html_source = browser.page_source

soup = BeautifulSoup(html_source, 'html.parser')

- 다음 시간에는 이번 시간에 가져온 이미지 태크의 속성 중에서 'src' 와 'alt' 만 가져와서 리스트에 담는 방법에 대해 설명합니다

오늘은 여기까지이며, 댓글과 하트는 제가 이글을 지속할 수 있게 해주는 힘이 됩니다.

감사합니다.

728x90

LIST

저작자표시 비영리 변경금지 (새창열림)

'파이썬 강좌(초급) > (실습) 크롤링' 카테고리의 다른 글

(실습)파이썬 네이버에서 강아지로 검색 후 강아지 이미지를 자동으로 크롤링 하는 프로그램 만들기 - 5.가져온 소스에서 이미지 링크와 설명만 뽑아서 리스트에 담아두기 (0)	2024.03.03
(실습)파이썬 네이버에서 강아지로 검색 후 강아지 이미지를 자동으로 크롤링 하는 프로그램 만들기 - 4.가져온 소스 필터링 테스트 하기 (0)	2024.03.03
(실습)파이썬 네이버에서 강아지로 검색 후 강아지 이미지를 자동으로 크롤링 하는 프로그램 만들기 - 2.네이버 검색 페이지 로딩하기 (1)	2024.03.03
(실습)파이썬 네이버에서 강아지로 검색 후 강아지 이미지를 자동으로 크롤링 하는 프로그램 만들기 - 1.셀레니움을 이용한 크롬브라우저 자동 띄우기 (0)	2024.03.03
(실습)파이썬 네이버에서 강아지로 검색 후 강아지 이미지를 자동으로 크롤링 하는 프로그램 만들기 - 0. 소개 (0)	2024.03.03

현재글(실습)파이썬 네이버에서 강아지로 검색 후 강아지 이미지를 자동으로 크롤링 하는 프로그램 만들기 - 3.네이버 검색 페이지에서 모든 소스 가져오기

250x250

- 우리 블로그의 목표 '파이썬 기초부터 차근 차근' 배워 보는 파기차차 블로그로는 고수님들을 위한 곳이 아니며, 이제 막 시작하시려는 분들, 코딩 초보자분들을 위한 블로그입니다. 우리 블로그의 목표는 아래와 같습니다. 1. 쉬운 코딩이어야 한다. 2. 빠르게 할 수 있어야 한다. 3. 즉시 할 수 있어야 한다. 4. 어딘가 써먹을 수 있어야 한다. 우리는 이 블로그를 통해 단기간 쉽고, 빠르게 파이썬을 익혀 즉시, 어딘가 써먹을 것입니다.

쿠버네티스, FTP, 크롤링, Karlo, ftp서버, gui, ChatGPT, openai, 윈도우, 셀레니움, 파이썬, 텔레그램, 구글클라우드플랫폼, API, 다운로드, 입문자, k8s, 파일전송, 초보, 검색,

Today :
Yesterday :

일	월	화	수	목	금	토
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30

파기차차