piwik/referrer-spam-blacklist

此软件包已被废弃,不再维护。作者建议使用 matomo/referrer-spam-blacklist 软件包。

社区贡献的引用垃圾邮件列表


README

这是一个由社区贡献的引用垃圾邮件列表,由 Matomo(前身为 Piwik)维护,Matomo 是领先的开放源代码网站分析平台。

用法

该列表存储在本存储库中的 spammers.txt 文件中。此文本文件每行包含一个主机。

您可以通过以下方式手动下载此文件:下载此文件,下载整个文件夹作为 zip 文件,或使用 git 克隆存储库。

git clone https://github.com/matomo-org/referrer-spam-list.git

PHP

如果您正在使用 PHP,您也可以通过 Composer 安装该列表。

composer require matomo/referrer-spam-blacklist

使用您喜欢的语言解析文件应该相当容易。请注意,该文件可以包含空行。

以下是一个使用 PHP 的示例

$list = file('spammers.txt', FILE_IGNORE_NEW_LINES | FILE_SKIP_EMPTY_LINES);

Nginx

Nginx 的 server 块可以配置为检查引用并返回错误

if ($http_referer ~ '0n-line.tv') {return 403;}
if ($http_referer ~ '100dollars-seo.com') {return 403;}
...

当列表合并时,列表长度超过了单个正则表达式的最大长度,因此必须将主机按上述方式拆分。

以下是一个创建 nginx 配置文件的 bash 脚本

sort spammers.txt | uniq | sed 's/\./\\\\./g' | while read host; 
do 
    echo "if (\$http_referer ~ '$host') {return 403;}" >> /etc/nginx/referer_spam.conf
done;

然后您可以在 server 块中 include /etc/nginx/referer_spam.conf;

现在作为一个每日 cron 作业,以便列表保持最新

0 0 * * * cd /etc/nginx/referrer-spam-blacklist/ && git pull > /dev/null && echo "" > /etc/nginx/referer_spam.conf && sort spammers.txt | uniq | sed 's/\./\\\\\\\\./g' | while read host; do echo "if (\$http_referer ~ '$host') {return 403;}" >> /etc/nginx/referer_spam.conf; done; service nginx reload > /dev/null

在 Matomo(前身为 Piwik)中

此列表包含在每次 Matomo 发布中,以便自动过滤引用垃圾邮件。Matomo 还会每周自动更新此列表到最新版本。

贡献

要将新的引用垃圾邮件添加到列表中,请点击此处编辑 spammers.txt 文件并选择 Create a new branch for this commit and start a pull request.。在您的 pull request 中,请解释引用域出现的位置以及为什么您认为它是垃圾邮件发送者。请为每个新域打开一个 pull request。

如果您打开 pull request,如果您保持每行一个主机名、保持列表按字母顺序排序以及使用 Linux 行结束符,这将受到赞赏。

请在搜索是否有人已报告该主机,然后再打开一个新的。

子域

Matomo 在此列表中对域名进行子字符串匹配,因此添加 semalt.com 就足以阻止所有子域引用,例如 semalt.semalt.com

但是,有些情况下,您只想添加子域而不是根域。例如,添加 referrerspammer.tumblr.com 但不要添加 tumblr.com,否则会影响所有 *.tumblr.com 网站。

排序

为了在分支间保持列表排序方式的一致性,建议让计算机进行排序。列表遵循在 sort 中实现的归并排序算法。您可以使用 sort 对列表进行排序并过滤重复项。

sort -uf -o spammers.txt spammers.txt

社区项目

Apache .htaccess 源地址垃圾邮件黑名单 - 为 Apache 用户编写的一个脚本,该脚本基于 spammers.txt 生成 RewriteConds 列表。

免责声明

此源地址垃圾邮件黑名单由社区贡献,提供现状。自行决定使用:可能不完整(尽管我们努力保持其更新)且可能包含过时条目(如果添加的主机名实际上不是垃圾邮件发送者,请告知我们)。

许可协议

公有领域(无版权)。