Skip to content

Latest commit

 

History

History
29 lines (15 loc) · 705 Bytes

readme.md

File metadata and controls

29 lines (15 loc) · 705 Bytes

트위터 이미지 크롤러입니다.

사용하기 위해서는 selenium, scrapy, pymongo, configparser를 설치해야합니다.

$ git clone https://github.com/snutiise/Twitter-Crawler.git

$ sudo pip install configparser pymongo selenium scrapy

$ cd Twitter-Crawler

$ scrapy crawl twitter


메타데이터 저장시 몽고디비를 이용하므로 몽고디비도 설치해야합니다.

mongodb config -> settings.py 파일참조



config 파일에서 수집하고 싶은 이미지에 대한 키워드와 페이지 수, 그리고 크롤러가 위치한 절대경로를 설정해주면 됩니다.

ex)

keyword=러블리즈

page=10

rootPath=/home/jsh/git/Twitter-Crawler/