Crawler để cào thông tin sản phẩm từ website https://www.thegioididong.com/
Hiện tại chỉ cào được các category sau:
- may-tinh-bang
- dtdd
- lap-top
- dong-ho-thong-minh
- dong-ho-deo-tay
Install Scrapy
pip install Scrapy
- Cào hết các category, hơi lâu tẹo :v
scrapy crawl tgdd
- Cào theo category
scrapy crawl tgdd -a category=may-tinh-bang