크롤링 👣 ▻ puppeteer

August 21, 2019

logo

Headless Chrome 쉽게 사용할 수 있는 Node Js 라이브러리

💎 목차

⚙️ 설치를 하며

$ npm install puppeteer

⬆ 목차


😳 코드를 보며

▸ screenshot

1

스크린샷을 저장한다.



▸ pdf

2

PDF 파일을 저장한다.



▸ emulate devices

3

디바이스 모드로 전환한다.



▸ setCookie

4

쿠키를 설정한다.



▸ tracing

5

접속 브라우저 정보를 추적한다.


⬆ 목차


🤔 생각해 보며

완성도세련도를 높이고자 몇 가지 모듈을 추가해보자.

# HTML DOM Element 접근에 용이한 모듈
$ npm install cheerio

# Excel 파일 생성 모듈
$ npm install exceljs

# 콘솔 입력 모듈
$ npm install readline-sync

6

해당 소스는 네이버 맵 크롤링 소스이다. 간략히 설명 하겠습니다.

  1. readline 모듈을 통해 검색어를 입력
  2. cheerio 모듈을 통해 손쉽게 Element 접근
  3. exceljs 모듈을 통해 데이터 수집이 완료 시 Excel 저장

⬆ 목차



출처

GitHub > puppeteer

여러분의 댓글이 큰힘이 됩니다. (๑•̀ㅂ•́)و✧


[AGUMON]
Written by@[AGUMON]
아구몬 기술 블로그

GitHubFacebook