proget-hq/google-play-scraper

一个用于从Google Play获取应用程序数据的PHP爬虫

0.2.2 2018-03-30 11:45 UTC

This package is auto-updated.

Last update: 2024-09-15 01:35:28 UTC


README

Build Status

一个用于从Google Play获取应用程序数据的PHP爬虫。

安装

raulr/google-play-scraper 添加到 composer.json 文件中的依赖项

$ composer require raulr/google-play-scraper

使用方法

首先创建一个 Scraper 实例。

use Raulr\GooglePlayScraper\Scraper;

$scraper = new Scraper();

有多种方法可以配置默认行为

  • setDelay($delay):设置请求Google Play站点之间的延迟(毫秒)。
  • setDefaultLang($lang):设置所有请求的默认语言。$lang 必须是ISO_639-1两位字母语言代码。如果未设置,则默认语言为 en
  • setDefaultCountry($country):设置所有请求的默认国家。$country 必须是ISO_3166-1两位字母国家代码。如果未设置,则默认国家为 us

getApp

给定ID获取应用程序信息。

参数

  • $id:Google Play应用程序标识符。
  • $lang:(可选,默认为 null):覆盖默认语言。
  • $country:(可选,默认为 null):覆盖默认国家。

示例

$app = $scraper->getApp('com.mojang.minecraftpe');

返回

array (
  'id' => 'com.mojang.minecraftpe',
  'url' => 'https://play.google.com/store/apps/details?id=com.mojang.minecraftpe',
  'image' => 'https://lh3.googleusercontent.com/30koN0eGl-LHqvUZrCj9HT4qVPQdvN508p2wuhaWUnqKeCp6nrs9QW8v6IVGvGNauA=w300',
  'title' => 'Minecraft: Pocket Edition',
  'author' => 'Mojang',
  'author_link' => 'https://play.google.com/store/apps/developer?id=Mojang',
  'categories' => array (
    'Arcade',
    'Creativity',
  ),
  'price' => '$6.99',
  'screenshots' => array (
    'https://lh3.googleusercontent.com/VkLE0e0EDuRID6jdTE97cC8BomcDReJtZOem9Jlb14jw9O7ytAGvE-2pLqvoSJ7w3IdK=h310',
    'https://lh3.googleusercontent.com/28b1vxJQe916wOaSVB4CmcnDujk8M2SNaCwqtQ4cUS0wYKYn9kCYeqxX0uyI2X-nQv0=h310',
    // [...]
  ),
  'description' => 'Our latest free update includes the Nether and all its inhabitants[...]',
  'description_html' => 'Our latest free update includes the Nether and all its inhabitants[...]',
  'rating' => 4.4726405143737793,
  'votes' => 1136962,
  'last_updated' => 'October 22, 2015',
  'size' => 'Varies with device',
  'downloads' => '10,000,000 - 50,000,000',
  'version' => 'Varies with device',
  'supported_os' => 'Varies with device',
  'content_rating' => 'Everyone 10+',
  'whatsnew' => 'Build, explore and survive on the go with Minecraft: Pocket Edition[...]',
  'video_link' => 'https://www.youtube.com/embed/D2Z9oKTzzrM?ps=play&vq=large&rel=0&autohide=1&showinfo=0&autoplay=1',
  'video_image' => 'https://i.ytimg.com/vi/D2Z9oKTzzrM/hqdefault.jpg',
)

以下字段可能包含一个 null 值:pricesizedownloadsversionwhatsnewvideo_linkvideo_imagepricenull 表示应用程序是免费的。

getApps

给定多个ID获取多个应用程序的信息。

参数

  • $ids:Google Play应用程序标识符数组。
  • $lang:(可选,默认为 null):覆盖默认语言。
  • $country:(可选,默认为 null):覆盖默认国家。

示例

$app = $scraper->getApps(array(
    'com.mojang.minecraftpe',
    'com.google.android.youtube',
));

getCategories

返回一个包含Google Play中现有类别的数组。

示例

use Raulr\GooglePlayScraper\Scraper;

$scraper = new Scraper();
$categories = $scraper->getCategories();

返回

array (
  'BOOKS_AND_REFERENCE',
  'BUSINESS',
  'COMICS',
  'COMMUNICATION',
  'EDUCATION',
  'ENTERTAINMENT',
  'FINANCE',
  'HEALTH_AND_FITNESS',
  'LIBRARIES_AND_DEMO',
  'LIFESTYLE',
  'APP_WALLPAPER',
  'MEDIA_AND_VIDEO',
  'MEDICAL',
  'MUSIC_AND_AUDIO',
  'NEWS_AND_MAGAZINES',
  'PERSONALIZATION',
  'PHOTOGRAPHY',
  'PRODUCTIVITY',
  'SHOPPING',
  'SOCIAL',
  'SPORTS',
  'TOOLS',
  'TRANSPORTATION',
  'TRAVEL_AND_LOCAL',
  'WEATHER',
  'APP_WIDGETS',
  'GAME_ACTION',
  'GAME_ADVENTURE',
  'GAME_ARCADE',
  'GAME_BOARD',
  'GAME_CARD',
  'GAME_CASINO',
  'GAME_CASUAL',
  'GAME_EDUCATIONAL',
  'GAME_MUSIC',
  'GAME_PUZZLE',
  'GAME_RACING',
  'GAME_ROLE_PLAYING',
  'GAME_SIMULATION',
  'GAME_SPORTS',
  'GAME_STRATEGY',
  'GAME_TRIVIA',
  'GAME_WORD',
  'FAMILY',
  'FAMILY_ACTION',
  'FAMILY_BRAINGAMES',
  'FAMILY_CREATE',
  'FAMILY_EDUCATION',
  'FAMILY_MUSICVIDEO',
  'FAMILY_PRETEND',
)

getCollections

返回一个包含Google Play中现有集合的数组。

示例

$collections = $scraper->getCollections();

返回

array (
  'topselling_free',
  'topselling_paid',
  'topselling_new_free',
  'topselling_new_paid',
  'topgrossing',
  'movers_shakers',
)

getList

根据集合和可选的分类检索Google Play应用程序列表。

参数

  • $collection:要检索的Google Play集合。有关可能的值,请参阅getCollections
  • $category:(可选,默认为 null):通过此类别过滤请求。有关可能的值,请参阅getCategories
  • $lang:(可选,默认为 null):覆盖默认语言。
  • $country:(可选,默认为 null):覆盖默认国家。

示例

$apps = $scraper->getList('topselling_free', 'SOCIAL');

返回

array (
  array (
    'id' => 'com.facebook.katana',
    'url' => 'https://play.google.com/store/apps/details?id=com.facebook.katana',
    'title' => 'Facebook',
    'image' => 'https://lh3.googleusercontent.com/ZZPdzvlpK9r_Df9C3M7j1rNRi7hhHRvPhlklJ3lfi5jk86Jd1s0Y5wcQ1QgbVaAP5Q=w340',
    'author' => 'Facebook',
    'rating' => 3.9888803958892822,
    'price' => null,
  ),
  array (
    'id' => 'com.snapchat.android',
    'url' => 'https://play.google.com/store/apps/details?id=com.snapchat.android',
    'title' => 'Snapchat',
    'image' => 'https://lh4.ggpht.com/vdK_CsMSsJoYvJpYgaj91fiJ1T8rnSHHbXL0Em378kQaaf_BGyvUek2aU9z2qbxJCAFV=w340',
    'author' => 'Snapchat Inc',
    'rating' => 3.8660063743591309,
    'price' => null,
  ),
  // [...]
)

getDetailList

getList相同,但返回完整的应用程序详细数据。为列表中的每个应用程序进行一次额外的请求,以获取其详细信息。

getListChunk

检索Google Play应用程序列表的一部分。

参数

  • $collection:要检索的Google Play集合。有关可能的值,请参阅getCollections
  • $category:(可选,默认为 null):通过此类别过滤请求。有关可能的值,请参阅getCategories
  • $start:(可选,默认为 0):起始索引。必须是介于 0500 之间的值。
  • $num:(可选,默认为 60):要检索的应用程序数量。必须是介于 0120 之间的值。
  • $lang:(可选,默认为 null):覆盖默认语言。
  • $country:(可选,默认为 null):覆盖默认国家。

示例

$apps = $scraper->getListChunk('topselling_free', 'SOCIAL', 20, 80);

getDetailListChunk

getListChunk相同,但返回完整的应用程序详细数据。为列表中的每个应用程序进行一次额外的请求,以获取其详细信息。

getSearch

根据搜索查询和可选的价格和评分过滤条件检索Google Play应用程序列表。

参数

  • $query:搜索查询。
  • $price:(可选,默认为 all):通过价格过滤请求。可能的值:allfreepaid
  • $rating:(可选,默认为 all):通过评分过滤请求。可能的值:all4+
  • $lang:(可选,默认为 null):覆盖默认语言。
  • $country:(可选,默认为 null):覆盖默认国家。

示例

$apps = $scraper->getSearch('unicorns', 'free', '4+');

getDetailSearch

getSearch相同,但返回完整的应用数据详情。对于搜索结果中的每个应用,都会额外发送一个请求以获取其详细信息。