bborrel / google-scholar-profile-parser
解析Google Scholar个人主页页面。
Requires
- php: >=7.1.0
- ext-dom: *
- fabpot/goutte: ^3.2
Requires (Dev)
- dealerdirect/phpcodesniffer-composer-installer: ^0.7.0
- edgedesign/phpqa: ^1.22
- infection/infection: ^0.15.0
- jakub-onderka/php-parallel-lint: ^1.0
- object-calisthenics/phpcs-calisthenics-rules: ^3.5
- pheromone/phpcs-security-audit: ^2.0
- php-coveralls/php-coveralls: ^2.1
- phpcompatibility/php-compatibility: ^9.1
- phpstan/phpstan: ^0.12.0
- phpunit/phpunit: ^8.0
- vimeo/psalm: ^4.9
README
Google Scholar Profile Parser 是一个PHP库,它解析来自Google Scholar网站学者个人主页页面的HTML,并将其数据转换成常规的PHP数据结构。
解析的学者数据包括
- 其出版物列表(标题、链接、作者、出版商详情、引用次数)
- 其引用统计(引用次数、h指数、i10指数)
目录表
项目理由
如维基百科页面所述
Google Scholar 是一个免费可访问的搜索引擎,它索引了各种出版格式和学科领域的学术文献的全文本或元数据。Google Scholar 是一个索引学者出版物和引用的网站。
不幸的是,Google Scholar 网站没有提供API,我需要一种方式来获取学者的数据。
因此,当我寻找一个可以解析Google Scholar网站个人主页页面的PHP库时,我只找到了Scholar parser,由Daniel Schreij提供。但我对这个库依赖于PhantomJS(开发已暂停,并且可能不会恢复,导致用户得不到支持)感到不满。因此,我决定重写这个库,重新设计使其仅依赖于PHP,而不需要更多的JavaScript。
需求
如composer.json中所述,它需要
- PHP 7.1+
- PHP DOM扩展
要在PHP 5.6+上运行此库,请安装其1.x版本。
安装
使用Composer下载并安装此库以及其依赖项。
composer require bborrel/google-scholar-profile-parser
使用
请参阅库的文档中的示例。
版本控制
此库使用SemVer进行版本控制。有关可用版本,请参阅此存储库上的标签。有关功能更改,请参阅CHANGELOG.md文件以获取详细信息。
代码质量
此库的代码
- 遵循PSR-1和PSR-12编码标准
- 遵循PSR-4自动加载标准
- 使用PHPQA(包含多个工具,特别是PHPCS、PHPMD、PHPStan和Psalm)进行静态分析,并使用Code Climate(配置了Phan、PHPMD、SonarPHP)进行辅助
- 使用PHPUnit进行单元测试(代码覆盖率在Coveralls上)
- 使用Infection进行突变测试
- 测试了与不同版本的PHP的兼容性(详细信息请参阅.travis.yml)
- 检查了其中一些依赖项(由PHP安全公告数据库列出)以识别已知的安全问题
- 在TravisCI上进行持续集成
只要在运行install或update Composer命令时没有指定选项--no-dev,这些工具就会与库一起安装。
通过PHPQA运行静态分析工具和单元测试
./vendor/bin/phpqa --analyzedDirs=. --ignoredDirs=build,tests,vendor --report
要查看PHPQA生成的报告,请使用浏览器打开文件./build/phpqa.html。
作者
许可证
本库采用GPL-3.0-only许可证,有关详细信息,请参阅LICENSE.md文件。