php爬虫类库,支持自定义

自定义语法:

随机类(内容可自定义,左边小于右边): $(0-66)$随机返回0到66的一个数字,$(a-z)$随机返回a-z的一个字母,$(a-H)$随机返回a-H的一个字母,,$(a,3,6,m)$随机返回括号中的字母或数字,用逗号隔开,$(mix)$随机返回数字或字母

顺序类(循环式,到达最右边重新从左开始): $to(0-9)$依次返回0-9数字,除了$(mix)$其余加上to都为顺序化

使用教程:

 

$curl=new curl(); 实例化,可有参数url,表示直接为url实例化

$curl->send(); 获取数据,不能使用自定义语法

$curl->send_ext();获取数据,能使用自定义语法

$curl->echo_help();输出帮助信息,参数1以html形式输出,0为默认格式,默认1;

【本类成员方法中,输出类以echo_开头,回调类以return_开头】

修改配置直接修改成员变量,例如修改url:

$curl->url=””;

参数包含以下几个:

url 抓取链接

ua 设置用户代理

cookie 设置cookie

echo_header 是否输出头部信息,默认0

deep 递归深度,默认0,此递归不会追加参数,建议设置real_url

rand_ip 随机ip,默认0,若为1也随机,也可以填指定ip

reffer 开源地址

timeout 超时时间,默认30秒

header 设置header头部,为数组,非数组无效

method 方法,默认get,也可为post, put等等

post_data 非get方法数据,例如method为post时需要发送的数据,形式同get,如: a=1&b=2

real_url 发送数据前先获取真实地址,默认1,适用于网页存在跳转而获取不到数据的情况

nobody 不输出页面内容,默认0,建议配合echo_header,若两者都为0则无输出

下载链接:蓝奏云

© 版权声明
THE END
喜欢就支持一下吧
点赞0 分享
评论 抢沙发

请登录后发表评论

    暂无评论内容