digitalist-open-cloud/matomo-bot-tracker

Matomo的Bot Tracker

5.2.16 2024-08-30 14:11 UTC

README

您是否在跟踪充满机器人的数据?这种流量通常对您没有用,只是干扰。Bot Tracker会从您的常规数据中删除这些访问,并提供单独的报告,以便您可以看到哪些机器人正在访问您的网站。使用Matomo和Bot Tracker,您可以了解您的网站上的机器人流量。

描述

Bot Tracker是一个插件,用于排除并单独跟踪机器人、蜘蛛和网络爬虫对您网站的访问。由于Matomo不存储用户代理,Bot Tracker只能从您将其添加到其列表中的那一刻开始跟踪新机器人(无法进行追溯跟踪)。

许多网络爬虫、蜘蛛和机器人不会加载页面中的图片并且不会执行JavaScript。因此,如果您不使用PHP-API,就无法使用Matomo跟踪它们。Bot Tracker只能跟踪由Matomo本身捕获的机器人。换句话说,如今许多爬虫正在使用无头浏览器,并且它们确实执行JavaScript。

它的工作原理

该插件扫描任何传入访问的用户代理中的特定关键词。如果找到关键词,则将访问排除在常规日志之外,并在Bot Tracker报告中单独记录。

如果您为机器人条目启用了“额外统计”,您将获得有关机器人访问的更多深入了解,并在Bot Tracker小部件中获取这些信息:额外统计。

您可以在“管理”->“Bot Tracker”->“配置”中添加/删除/修改关键词。

使用设备检测器跟踪识别的机器人

作为对机器人的额外跟踪,您可以通过激活“管理”->“常规设置”->“Bot Tracker”中的设置或通过在config.ini.php中设置来收集Matomo Device Detector识别的机器人。

[BotTracker]
track_device_detector_bots = 1

这是为了收集识别机器人的用户代理数据,您可以将其用于使用Bot Tracker进行更详细的跟踪。

安装/更新

查看https://matomo.org/faq/plugins/faq_21/

机器人的信息来源,如爬虫、爬虫、爬虫等

使用日志分析导入日志

Matomo通常附带一个python脚本来导入服务器日志,当您无法在网站上注入JavaScript来跟踪访客时,可以使用import_logs.py。通过此插件附带的补丁(位于patches文件夹中),您可以在使用导入的日志的情况下像往常一样使用Bot Tracker。只需将补丁复制到misc/log-analytics,然后运行patch -p1 < import_logs.patch,机器人将由Bot Tracker插件处理。

然后,您可以复制日志到您的Matomo实例并运行类似以下命令:

python misc/log-analytics/import_logs.py --url=https://my-matomo-instance.org --idsite=1 --recorders=8 --enable-http-errors --enable-http-redirects --enable-static --enable-bots localhost.access_log

有关日志分析的文档,请参阅文档页面

许可协议

GPL v3 /公平使用

由Digitalist Open Tech提供的Matomo插件

此插件由Thomas--F创建,并作为向Matomo 5升级贡献的一部分由Digitalist接管。

有关Digitalist提供的插件的更多信息,请参阅我们的插件页面