piwik / referrer-spam-blacklist
Replaces
- dev-master
- 4.0.0
- 3.11.0
- 3.10.0
- 1.1.2
- 1.1.1
- 1.1.0
- 1.0.13
- 1.0.12
- 1.0.11
- 1.0.10
- 1.0.9
- 1.0.8
- 1.0.7
- 1.0.6
- 1.0.5
- 1.0.4
- 1.0.3
- 1.0.2
- 1.0.1
- 1.0.0
- dev-spmedia-patch-34
- dev-prtemplate
- dev-spmedia-patch-33
- dev-spmedia-patch-32
- dev-spmedia-patch-31
- dev-spmedia-patch-30
- dev-spmedia-patch-29
- dev-readme_pr
- dev-spmedia-patch-28
- dev-spmedia-patch-27
- dev-spmedia-patch-26
- dev-spmedia-patch-25
- dev-spmedia-patch-24
- dev-spmedia-patch-23
- dev-spmedia-patch-22
- dev-spmedia-patch-21
- dev-spmedia-patch-20
- dev-spmedia-patch-19
- dev-revert-1051-patch-42
- dev-spmedia-patch-18
- dev-spmedia-patch-17
- dev-spmedia-patch-16
- dev-spmedia-patch-15
- dev-spmedia-patch-14
- dev-spmedia-patch-13
- dev-spmedia-patch-12
- dev-spmedia-patch-11
- dev-spmedia-patch-10
- dev-spmedia-patch-9
- dev-spmedia-patch-8
- dev-ekwiaciarz
- dev-spmedia-patch-7
- dev-spmedia-patch-6
- dev-spmedia-patch-5
- dev-spmedia-patch-4
- dev-spmedia-patch-3
- dev-spmedia-patch-2
- dev-spmedia-patch-1
This package is auto-updated.
Last update: 2024-09-20 00:38:50 UTC
README
这是一个由社区贡献的引用垃圾邮件列表,由 Matomo(前身为 Piwik)维护,Matomo 是领先的开放源代码网站分析平台。
用法
该列表存储在本存储库中的 spammers.txt
文件中。此文本文件每行包含一个主机。
您可以通过以下方式手动下载此文件:下载此文件,下载整个文件夹作为 zip 文件,或使用 git 克隆存储库。
git clone https://github.com/matomo-org/referrer-spam-list.git
PHP
如果您正在使用 PHP,您也可以通过 Composer 安装该列表。
composer require matomo/referrer-spam-blacklist
使用您喜欢的语言解析文件应该相当容易。请注意,该文件可以包含空行。
以下是一个使用 PHP 的示例
$list = file('spammers.txt', FILE_IGNORE_NEW_LINES | FILE_SKIP_EMPTY_LINES);
Nginx
Nginx 的 server
块可以配置为检查引用并返回错误
if ($http_referer ~ '0n-line.tv') {return 403;} if ($http_referer ~ '100dollars-seo.com') {return 403;} ...
当列表合并时,列表长度超过了单个正则表达式的最大长度,因此必须将主机按上述方式拆分。
以下是一个创建 nginx 配置文件的 bash 脚本
sort spammers.txt | uniq | sed 's/\./\\\\./g' | while read host; do echo "if (\$http_referer ~ '$host') {return 403;}" >> /etc/nginx/referer_spam.conf done;
然后您可以在 server
块中 include /etc/nginx/referer_spam.conf;
现在作为一个每日 cron 作业,以便列表保持最新
0 0 * * * cd /etc/nginx/referrer-spam-blacklist/ && git pull > /dev/null && echo "" > /etc/nginx/referer_spam.conf && sort spammers.txt | uniq | sed 's/\./\\\\\\\\./g' | while read host; do echo "if (\$http_referer ~ '$host') {return 403;}" >> /etc/nginx/referer_spam.conf; done; service nginx reload > /dev/null
在 Matomo(前身为 Piwik)中
此列表包含在每次 Matomo 发布中,以便自动过滤引用垃圾邮件。Matomo 还会每周自动更新此列表到最新版本。
贡献
要将新的引用垃圾邮件添加到列表中,请点击此处编辑 spammers.txt 文件并选择 Create a new branch for this commit and start a pull request.
。在您的 pull request 中,请解释引用域出现的位置以及为什么您认为它是垃圾邮件发送者。请为每个新域打开一个 pull request。
如果您打开 pull request,如果您保持每行一个主机名、保持列表按字母顺序排序以及使用 Linux 行结束符,这将受到赞赏。
请在搜索是否有人已报告该主机,然后再打开一个新的。
子域
Matomo 在此列表中对域名进行子字符串匹配,因此添加 semalt.com
就足以阻止所有子域引用,例如 semalt.semalt.com
。
但是,有些情况下,您只想添加子域而不是根域。例如,添加 referrerspammer.tumblr.com
但不要添加 tumblr.com
,否则会影响所有 *.tumblr.com
网站。
排序
为了在分支间保持列表排序方式的一致性,建议让计算机进行排序。列表遵循在 sort 中实现的归并排序算法。您可以使用 sort 对列表进行排序并过滤重复项。
sort -uf -o spammers.txt spammers.txt
社区项目
Apache .htaccess 源地址垃圾邮件黑名单 - 为 Apache 用户编写的一个脚本,该脚本基于 spammers.txt
生成 RewriteConds 列表。
免责声明
此源地址垃圾邮件黑名单由社区贡献,提供现状。自行决定使用:可能不完整(尽管我们努力保持其更新)且可能包含过时条目(如果添加的主机名实际上不是垃圾邮件发送者,请告知我们)。
许可协议
公有领域(无版权)。