Skip to content

zhangslob/Web-crawler-engineer-for-Python

Repository files navigation

爬虫工程师(入门)

这里是爬虫工程师(入门)的课件及代码,可以帮助你学习Python爬虫,成为一名爬虫工程师。


课程大纲

1、什么是爬虫

  1. 网址
  2. 网页源代码
  3. 爬虫原理

2、初识Python爬虫

  1. 环境搭建
  2. 创建第一个实例
  3. 爬虫三步走

3、使用Requests爬取豆瓣短评

  1. Requests介绍
  2. 实战环节
  3. 一定要知道的爬虫协议

4、使用Xpath解析豆瓣短评

  1. 解析神器Xpath
  2. Xpath的使用
  3. 实战环节

5、使用pandas保存豆瓣短评数据

  1. 文件保存方法
  2. 实战环节

6、案例一:爬取知乎

  1. 爬虫的一般思路
  2. 实战环节

7、案例二:爬取拉勾

  1. 数据库学习
  2. 爬虫实战

8、案例三:爬取淘宝商品

  1. 全能的Selenium
  2. 实战环节
  3. 进阶课程

如果能帮助你,那就最好了。谢谢老板