cstayyab / google-play-scraper
一个用于从Google Play获取应用数据的PHP爬虫
0.3.1
2020-12-23 00:00 UTC
Requires
- fabpot/goutte: ^3.0
Requires (Dev)
- friendsofphp/php-cs-fixer: ^2.0
- mockery/mockery: ^1.0
- phpunit/phpunit: ^5.0
README
这是一个对raulr/google-play-scraper的改进分支,以便更好地控制包和未来的版本
一个用于从Google Play获取应用数据的PHP爬虫。
安装
将cstayyab/google-play-scraper
添加到您的composer.json
文件中的require依赖项
$ composer require cstayyab/google-play-scraper
用法
首先创建一个Scraper
实例。
use CSTayyab\GooglePlayScraper\Scraper; $scraper = new Scraper();
有几种方法可以配置默认行为
setDelay($delay)
:设置请求Google Play站点之间的延迟(以毫秒为单位)。setDefaultLang($lang)
:设置所有请求的默认语言。$lang
必须是ISO_639-1两位字母的语言代码。如果未设置,默认语言为en
。setDefaultCountry($country)
:设置所有请求的默认国家。$country
必须是ISO_3166-1两位字母的国家代码。如果未设置,默认国家为us
。
getApp
根据ID获取应用信息。
参数
$id
:Google Play应用标识符。$lang
:(可选,默认为null
):覆盖默认语言。$country
:(可选,默认为null
):覆盖默认国家。
示例
$app = $scraper->getApp('com.mojang.minecraftpe');
返回
array ( 'id' => 'com.mojang.minecraftpe', 'url' => 'https://play.google.com/store/apps/details?id=com.mojang.minecraftpe', 'image' => 'https://lh3.googleusercontent.com/VSwHQjcAttxsLE47RuS4PqpC4LT7lCoSjE7Hx5AW_yCxtDvcnsHHvm5CTuL5BPN-uRTP=s180', 'title' => 'Minecraft', 'author' => 'Mojang', 'author_link' => 'https://play.google.com/store/apps/developer?id=Mojang', 'categories' => array ( 'Arcade', 'Action & Adventure', ), 'price' => '$6.99', 'screenshots' => array ( 'https://lh3.googleusercontent.com/28b1vxJQe916wOaSVB4CmcnDujk8M2SNaCwqtQ4cUS0wYKYn9kCYeqxX0uyI2X-nQv0=w720-h310', 'https://lh3.googleusercontent.com/VkLE0e0EDuRID6jdTE97cC8BomcDReJtZOem9Jlb14jw9O7ytAGvE-2pLqvoSJ7w3IdK=w720-h310', // [...] ), 'description' => 'Explore infinite worlds and build everything from the simplest of homes to the grandest of castles[...]', 'description_html' => 'Explore infinite worlds and build everything from the simplest of homes to the grandest of castles[...]', 'rating' => 4.5, 'votes' => 2736136, 'last_updated' => 'May 23, 2019', 'size' => null, 'downloads' => '10,000,000+', 'version' => '1.11.4.2', 'supported_os' => '4.2 and up', 'content_rating' => 'Everyone 10+', 'whatsnew' => 'What\'s new in version 1.11?[...]', )
以下字段可能包含一个null
值:price
、last_updated
、size
、downloads
、version
、supported_os
、content_rating
、whatsnew
、video_link
和video_image
。price
为null
表示应用是免费的。
getApps
根据ID获取多个应用的信息。
参数
$ids
:Google Play应用标识符数组。$lang
:(可选,默认为null
):覆盖默认语言。$country
:(可选,默认为null
):覆盖默认国家。
示例
$app = $scraper->getApps(array( 'com.mojang.minecraftpe', 'com.google.android.youtube', ));
getCategories
返回Google Play中现有类别的数组。
示例
use CSTayyab\GooglePlayScraper\Scraper; $scraper = new Scraper(); $categories = $scraper->getCategories();
返回
array ( 'ART_AND_DESIGN', 'AUTO_AND_VEHICLES', 'BEAUTY', 'BOOKS_AND_REFERENCE', 'BUSINESS', 'COMICS', 'COMMUNICATION', 'DATING', 'EDUCATION', 'ENTERTAINMENT', 'EVENTS', 'FINANCE', 'FOOD_AND_DRINK', 'HEALTH_AND_FITNESS', 'HOUSE_AND_HOME', 'LIBRARIES_AND_DEMO', 'LIFESTYLE', 'MAPS_AND_NAVIGATION', 'MEDICAL', 'MUSIC_AND_AUDIO', 'NEWS_AND_MAGAZINES', 'PARENTING', 'PERSONALIZATION', 'PHOTOGRAPHY', 'PRODUCTIVITY', 'SHOPPING', 'SOCIAL', 'SPORTS', 'TOOLS', 'TRAVEL_AND_LOCAL', 'VIDEO_PLAYERS', 'ANDROID_WEAR', 'WEATHER', 'GAME', 'GAME_ACTION', 'GAME_ADVENTURE', 'GAME_ARCADE', 'GAME_BOARD', 'GAME_CARD', 'GAME_CASINO', 'GAME_CASUAL', 'GAME_EDUCATIONAL', 'GAME_MUSIC', 'GAME_PUZZLE', 'GAME_RACING', 'GAME_ROLE_PLAYING', 'GAME_SIMULATION', 'GAME_SPORTS', 'GAME_STRATEGY', 'GAME_TRIVIA', 'GAME_WORD', 'FAMILY', 'FAMILY_ACTION', 'FAMILY_BRAINGAMES', 'FAMILY_CREATE', 'FAMILY_EDUCATION', 'FAMILY_MUSICVIDEO', 'FAMILY_PRETEND' )
getCollections
返回Google Play中现有集合的数组。
示例
$collections = $scraper->getCollections();
返回
array ( 'topselling_free', 'topselling_paid', 'topselling_new_free', 'topselling_new_paid', 'topgrossing', 'movers_shakers', )
getList
根据集合和可选的分类检索Google Play应用列表。
参数
$collection
:要检索的Google Play集合。有关可能的值,请参阅getCollections。$category
:(可选,默认为null
)通过此分类过滤请求。有关可能的值,请参阅getCategories。$lang
:(可选,默认为null
):覆盖默认语言。$country
:(可选,默认为null
):覆盖默认国家。
示例
$apps = $scraper->getList('topselling_free', 'SOCIAL');
返回
array ( array ( 'id' => 'com.facebook.katana', 'url' => 'https://play.google.com/store/apps/details?id=com.facebook.katana', 'title' => 'Facebook', 'image' => 'https://lh3.googleusercontent.com/ZZPdzvlpK9r_Df9C3M7j1rNRi7hhHRvPhlklJ3lfi5jk86Jd1s0Y5wcQ1QgbVaAP5Q=w340', 'author' => 'Facebook', 'rating' => 3.9888803958892822, 'price' => null, ), array ( 'id' => 'com.snapchat.android', 'url' => 'https://play.google.com/store/apps/details?id=com.snapchat.android', 'title' => 'Snapchat', 'image' => 'https://lh4.ggpht.com/vdK_CsMSsJoYvJpYgaj91fiJ1T8rnSHHbXL0Em378kQaaf_BGyvUek2aU9z2qbxJCAFV=w340', 'author' => 'Snapchat Inc', 'rating' => 3.8660063743591309, 'price' => null, ), // [...] )
getDetailList
与getList相同,但返回完整的详细应用数据。将对列表中的每个应用都进行额外请求以获取其详细信息。
getListChunk
检索Google Play应用列表的一部分。
参数
$collection
:要检索的Google Play集合。有关可能的值,请参阅getCollections。$category
:(可选,默认为null
)通过此分类过滤请求。有关可能的值,请参阅getCategories。$start
:(可选,默认为0
):起始索引。必须是介于0
和180
之间的值。$num
:(可选,默认为60
):要检索的应用数量。必须是介于0
和120
之间的值。$lang
:(可选,默认为null
):覆盖默认语言。$country
:(可选,默认为null
):覆盖默认国家。
示例
$apps = $scraper->getListChunk('topselling_free', 'SOCIAL', 20, 80);
getDetailListChunk
与getListChunk相同,但返回完整的详细应用数据。将对列表中的每个应用都进行额外请求以获取其详细信息。
getSearch
根据搜索查询和可选的价格和评分过滤,检索Google Play应用列表。
参数
$query
:搜索查询。$price
: (可选,默认为all
) 通过价格过滤请求。可能值:all
、free
、paid
。$rating
: (可选,默认为all
) 通过评分过滤请求。可能值:all
、4+
。$lang
:(可选,默认为null
):覆盖默认语言。$country
:(可选,默认为null
):覆盖默认国家。
示例
$apps = $scraper->getSearch('unicorns', 'free', '4+');
getDetailSearch
与getSearch相同,但返回完整的应用数据。将为搜索结果中的每个应用额外发起一次请求以获取其详细信息。