常用爬虫框架汇总

常用的爬虫框架,方案汇总
更新于: 2021-12-25 14:01:20

常用框架列表

名称网站语言简介
puppeteerhttps://github.com/puppeteer/puppeteernodejsGoogle 出品的Headless 浏览器
scrapy

https://www.osgeo.cn/scrapy/intro/overview.html

https://docs.scrapy.org/en/latest/intro/tutorial.html

pythonpython里很强大的爬虫框架
gocollyhttps://github.com/gocolly/collygogo 语言的
 rubyhttps://github.com/afeiship/generator-tiny-railsruby个人自己的一个爬虫模板
cheeriohttps://cheerio.js.org/nodejsnodejs平台的一个 js 选择器
spider-flowhttps://github.com/ssssssss-team/spider-flowjava新一代爬虫平台,以图形化方式定义爬虫流程,不写代码即可完成爬虫。