Skip to content

sang556/csdn-spider

 
 

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

9 Commits
 
 
 
 
 
 

Repository files navigation

基于Python的Csdn博客爬虫(多线程)

说明

爬取Csdn某个博主的所有博文,并下载到本地(暂时只支持保存html格式),加入了多线程,爬取更快速。
SpiderGui----------------->爬虫gui界面
CsdnBlogSpider------------>爬虫主程序

环境

Python3.4

运行

* 确保安装Python解释器。
* SpiderGui.py
* 提示输入要爬取的博客名和开启线程数,根据自己需求配置
* 开始爬取,存储在当前目录的blog文件夹下

存在问题

本爬虫还不够完善,欢迎大家指导

About

爬取CSDN上的博客文章

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages

  • Python 100.0%