macklus/yii2-crawler

高级网络爬虫

安装次数: 67

依赖者: 0

建议者: 0

安全: 0

星标: 3

关注者: 3

分支: 0

开放性问题: 1

类型:yii2-extension

dev-master 2016-04-01 06:42 UTC

This package is not auto-updated.

Last update: 2024-09-14 19:25:31 UTC


README

高级网络爬虫模块

特性

  • 单个对象上的多个连接
  • 定义和使用多个代理
  • 定义和使用多个身份(用户名/密码)

安装

使用composer安装

安装此扩展的首选方式是通过 composer

运行以下命令之一:

php composer.phar require --prefer-dist macklus/yii2-geoselect "*"

"macklus/yii2-geoselect": "*"

将以下内容添加到您的 composer.json 文件的require部分。

使用方法

创建新对象

<?php

namespace app\controllers;

use macklus\Crawler\Crawler;

class TestController extends Controller
{
    public function actionCraw()
    {
        $crawler = new Crawler();
    }
}

用户代理

$crawler->setUA($browser)
/*
 * Browser could be chrome, firefox or explorer
 */

身份

$crawler->setUser($name, $user, $password)
$crawler->setUsers(['user1' => ['username' => 'jhon', 'password' => 'doe']])

代理

$crawler->setProxy($name, $string)
$crawler->setProxys([['proxy1' => 'proxystring', 'proxy2' => 'proxy2string]])
/*
 * string should contain all proxy info, like http://username:password@proxy.thing.com:8080/
 */