digitalist-open-cloud / matomo-bot-tracker
Matomo的Bot Tracker
Requires
- composer/installers: ~1.0
Requires (Dev)
- dealerdirect/phpcodesniffer-composer-installer: ^1.0
- pheromone/phpcs-security-audit: ^2.0
- php-webdriver/webdriver: ^1.15
- phpstan/phpstan: ^1.10.62
- phpstan/phpstan-deprecation-rules: ^1.1
- phpunit/phpunit: 9.6.4
- psr/container: 1.1.2
- slevomat/coding-standard: ^8.8
- spaze/phpstan-disallowed-calls: ^2.12
- squizlabs/php_codesniffer: ^3.7
This package is auto-updated.
Last update: 2024-09-18 15:34:07 UTC
README
您是否在跟踪充满机器人的数据?这种流量通常对您没有用,只是干扰。Bot Tracker会从您的常规数据中删除这些访问,并提供单独的报告,以便您可以看到哪些机器人正在访问您的网站。使用Matomo和Bot Tracker,您可以了解您的网站上的机器人流量。
描述
Bot Tracker是一个插件,用于排除并单独跟踪机器人、蜘蛛和网络爬虫对您网站的访问。由于Matomo不存储用户代理,Bot Tracker只能从您将其添加到其列表中的那一刻开始跟踪新机器人(无法进行追溯跟踪)。
许多网络爬虫、蜘蛛和机器人不会加载页面中的图片并且不会执行JavaScript。因此,如果您不使用PHP-API,就无法使用Matomo跟踪它们。Bot Tracker只能跟踪由Matomo本身捕获的机器人。换句话说,如今许多爬虫正在使用无头浏览器,并且它们确实执行JavaScript。
它的工作原理
该插件扫描任何传入访问的用户代理中的特定关键词。如果找到关键词,则将访问排除在常规日志之外,并在Bot Tracker报告中单独记录。
如果您为机器人条目启用了“额外统计”,您将获得有关机器人访问的更多深入了解,并在Bot Tracker小部件中获取这些信息:额外统计。
您可以在“管理”->“Bot Tracker”->“配置”中添加/删除/修改关键词。
使用设备检测器跟踪识别的机器人
作为对机器人的额外跟踪,您可以通过激活“管理”->“常规设置”->“Bot Tracker”中的设置或通过在config.ini.php
中设置来收集Matomo Device Detector识别的机器人。
[BotTracker] track_device_detector_bots = 1
这是为了收集识别机器人的用户代理数据,您可以将其用于使用Bot Tracker进行更详细的跟踪。
安装/更新
查看https://matomo.org/faq/plugins/faq_21/
机器人的信息来源,如爬虫、爬虫、爬虫等
- https://raw.githubusercontent.com/monperrus/crawler-user-agents/master/crawler-user-agents.json
- https://radar.cloudflare.com/traffic/verified-bots
- https://darkvisitors.com/
- https://badbot.org/
- https://udger.com/resources/ua-list/crawlers
使用日志分析导入日志
Matomo通常附带一个python脚本来导入服务器日志,当您无法在网站上注入JavaScript来跟踪访客时,可以使用import_logs.py
。通过此插件附带的补丁(位于patches
文件夹中),您可以在使用导入的日志的情况下像往常一样使用Bot Tracker。只需将补丁复制到misc/log-analytics
,然后运行patch -p1 < import_logs.patch
,机器人将由Bot Tracker插件处理。
然后,您可以复制日志到您的Matomo实例并运行类似以下命令:
python misc/log-analytics/import_logs.py --url=https://my-matomo-instance.org --idsite=1 --recorders=8 --enable-http-errors --enable-http-redirects --enable-static --enable-bots localhost.access_log
有关日志分析的文档,请参阅文档页面。
许可协议
GPL v3 /公平使用
由Digitalist Open Tech提供的Matomo插件
此插件由Thomas--F创建,并作为向Matomo 5升级贡献的一部分由Digitalist接管。
有关Digitalist提供的插件的更多信息,请参阅我们的插件页面。