GitHub - snutiise/Twitter-Crawler: Twitter Crawler

트위터 이미지 크롤러입니다.

사용하기 위해서는 selenium, scrapy, pymongo, configparser를 설치해야합니다.

$ sudo pip install configparser pymongo selenium scrapy

$ cd Twitter-Crawler

$ scrapy crawl twitter

메타데이터 저장시 몽고디비를 이용하므로 몽고디비도 설치해야합니다.

mongodb config -> settings.py 파일참조

config 파일에서 수집하고 싶은 이미지에 대한 키워드와 페이지 수, 그리고 크롤러가 위치한 절대경로를 설정해주면 됩니다.

ex)

keyword=러블리즈

page=10

rootPath=/home/jsh/git/Twitter-Crawler/

Name		Name	Last commit message	Last commit date
Latest commit History 14 Commits
storage		storage
twitter		twitter
chromedriver		chromedriver
ghostdriver.log		ghostdriver.log
readme.md		readme.md
scrapy.cfg		scrapy.cfg
setting.conf		setting.conf