์ฌ์ฉํ๊ธฐ ์ํด์๋ selenium, scrapy, pymongo, configparser๋ฅผ ์ค์นํด์ผํฉ๋๋ค.
$ git clone https://github.com/snutiise/Twitter-Crawler.git
$ sudo pip install configparser pymongo selenium scrapy
$ cd Twitter-Crawler
$ scrapy crawl twitter
๋ฉํ๋ฐ์ดํฐ ์ ์ฅ์ ๋ชฝ๊ณ ๋๋น๋ฅผ ์ด์ฉํ๋ฏ๋ก ๋ชฝ๊ณ ๋๋น๋ ์ค์นํด์ผํฉ๋๋ค.
mongodb config -> settings.py ํ์ผ์ฐธ์กฐ
config ํ์ผ์์ ์์งํ๊ณ ์ถ์ ์ด๋ฏธ์ง์ ๋ํ ํค์๋์ ํ์ด์ง ์, ๊ทธ๋ฆฌ๊ณ ํฌ๋กค๋ฌ๊ฐ ์์นํ ์ ๋๊ฒฝ๋ก๋ฅผ ์ค์ ํด์ฃผ๋ฉด ๋ฉ๋๋ค.
ex)
keyword=๋ฌ๋ธ๋ฆฌ์ฆ
page=10
rootPath=/home/jsh/git/Twitter-Crawler/