目前php也有很多好用的爬虫框架,今天主要推荐一个集成度非常高,非常易用,非常优雅的php爬虫框架QueryList.
这个框架从已安装度,上手度,抓取规则编写等,都非常好用,所以在此强烈推荐。
首先介绍下使用方法,推荐的方法是使用composer进行安装。
composer require jaeger/querylist
一行命令就可以安装完成,需要满足php>7,php7已经发布很久了,很稳定,性能提升非常大,因此建议新项目最好都在php7环境运行。
安装完成后,我们只需要在入口文件中引入自动加载文件autoload.php就可以使用了。
下面给出一个简单的例子
'link'=>array('h3>a','href') ]) ->queryData(); print_r($data);
执行php index.php 就可以抓取成功
简单几句话就成功抓取了,querylist采用的采集规则和jquery很类似,对于熟悉前端的人来说非常方便,有时间我会介绍些采集规则如何编写。
Comments are closed.