본문 바로가기

Good source

파이썬 몰라도 괜찮아. 간편 웹 크롤링 도구 리스틀리

반응형
웹페이지를 엑셀 데이터로 바꿔주는 간편 웹 크롤링 도구 '리스틀리(listly)'

 

직업 특성상 데이터로 구성된 인사이트나 웹 보고서를 자주 접하고 있다.

마우스 크롤링으로 땡겨와서 엑셀에 저장해야 할 때 근본적인 원인은 모르겠으나, 

원하는 모양대로 붙여지지 않는 경우가 굉장히 많다. 

 

간혹 메모장에 붙였다가 엑셀로 갈 경우 괜찮은 케이스들도 있지만,

오늘은 그것보다 훨씬 유용한 웹 크롤링 도구를 소개한다. 

 

 

데이터 추출을 클릭 1번에 '리스틀리'

https://www.listly.io/ko

 

리스틀리 | 단숨에 웹데이터 추출!

무료 크롬확장프로그램으로 모든 웹사이트에서 데이터 수집하세요. 단숨에 웹 데이터를 엑셀 파일로 변환합니다. 깨끗하게 정리된 데이터로 여러분의 비즈니스를 성장시켜 드립니다.

www.listly.io

 

웹 크롤링 프로그램 리스틀리(listly)는 구글 크롬에서 확장프로그램 설치만으로

다양한 웹환경에서 아주 간편하게 데이터를 긁어 올 수 있다. 

 

 

 

1. 리스틀리를 구글 크롬에 설치하는 방법 

 

크롬에서 설치하는 방법은 아주 간단하다.

크롬 웹 스토어에 방문하여 리스틀리를 검색 (바로가기 : https://bit.ly/3PtyZ5g)

하여 [Chrome에 추가] 버튼을 클릭한다.  (아래 화면은 이미 설치되어 있는 화면)

 

 

 

2. 크롬 브라우저에서 리스틀리를 핀고정.

 

원하는 웹페이지에서 크롤링이 가능하도록 크롬 브라우저 우상단에서 리스틀리를 핀고정해둔다. 

 

 

 

 

3. 웹 크롤링이 필요한 웹사이트에 방문.

 

샘플화면은 가장 만만한 네이버 쇼핑을 무작위로 들어왔다. 

방문한 페이지에서 핀고정해둔 리스틀리 아이콘을 클릭하면 전체 또는 부분을 선택할 수 있다. 

개인적 사용 경험으로는 전체를 쓸 일은 거의 없었고,

부분 클릭 후 마우스를 이동하면 아래와 같이 크롤링 할 영역이 표시된다.

마우스 위치에 따라 크롤링되는 범위가 다르니 필요한 영역이 지정되도록 마우스를 움직여주자. 

 

 

 

 

4. 영역 지정이 완료되면 Listly 실행

 

실행 화면을 클릭하면 새 페이지가 열리면서 클로링 할 데이터가 표시되며, 

엑셀로 다운을 클릭하면 원하는 페이지가 쉽게 크롤링 된다. 

예전에는 회원 가입 없이도 사용이 가능했었는데 최근에는 로그인 요청 화면이 뜨는 것으로 확인했다. 

현재까지 회원 가입은 무료이므로 간단히 이메일 주소 입력 후 가입하면 된다. 

 

 

 

 

5. 다운 받은 엑셀 데이터를 정리 

 

이유는 모르겠으나 보통 칼럼명이 같이 딸려오진 않아서 별도 정리가 필요하긴 하지만 

이정도 편의성을 제공한다면 칼럼명쯤 충분히 수작업 할 용의가 있다.  

 

 

데이터 분석이 여러 방향에서 쓰이며 파이썬 같은 프로그램을 사용하는 사람들이 많아지고 있지만

프로그램에 재능이 없는 나같은 사람은 웹 데이터만 편하게 긁어와도 제법 유용하게 사용이 가능하다. 

 

엑셀 복붙으로 깨지는 웹 데이터에 스트레스를 받아 본 적이 있다면

지금 바로 리스틀리를  확장 프로그램을 설치해 사용해 보길 추천한다. 

 

반응형