Skip to content

Orange2107/douban_spider

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

7 Commits
 
 
 
 
 
 

Repository files navigation

douban_spider. A easy program to practice spider skill

使用Python使用对豆瓣电影top250进行爬虫

  • getdata函数
    • askurl函数
      • 使用urllib.request.Request,封装浏览器信息成为一个对象(req),目的是把Python伪装成浏览器。
      • 使用urllib.request.openurl,把对象req发送给服务器,获得服务器返回数据。
    • 使用Beautifusoup对返回的数据进行解析,采用fin_all函数查找带有目的数据的模块。
    • 使用正则表达式对模块中信息进行提取
  • savedata函数
    • 存入excel表格或者放入数据库中 image

About

No description, website, or topics provided.

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages