垃圾模块

由一路上有亮提交于 8 March 2012

这是垃圾邮件模块的文档页面。文件正在收集问题＃455066：用法和API文档需要放在这里时，一节完成。

简介

目前垃圾邮件模块处理垃圾评论，节点和用户。垃圾邮件模块为Drupal其他垃圾邮件模块不同，作为一个独立的插件，不依赖于第三方为处理垃圾邮件（虽然一个可选的过滤器模块，通过垃圾API创建的任何其他过滤器模块以及）。你得到控制会发生什么，以及它是如何发生的。

安装

垃圾模块的安装很简单：

下载最新版本的垃圾，从项目的页面。
提取它，并移到垃圾邮件文件夹目录的<drupal /网站/ /模块/或<drupal目录的/网站/默认/模块/
在你的网站，去管理»网站建设»模块，使垃圾邮件模块，和所有要使用的过滤器模块。
调整中的设置管理»网站配置»垃圾，你就大功告成了

使用垃圾邮件模块

新的内容可以通过启用垃圾邮件过滤器。这些过滤器分配一个介于0和99，在更高的分数意味着内容是更多的垃圾邮件得分。

得分相等或更大的垃圾邮件的阈值，然后标记为垃圾邮件，并根据您的配置，是未发表的，发送垃圾邮件队列，或删除。

标记为垃圾邮件的内容（节点，注释，用户）上显示的管理»内容管理»垃圾页面。从这里，你可以选择“标记为垃圾邮件”，将设置该项目的得分为零（和发布它，如果它是未发表的）。您还可以选择发布或取消发布的垃圾邮件。

反馈

“ 反馈 “选项卡允许您可以看到您的用户评论以及他们的论据，为什么它是不是垃圾。被错误地标记为垃圾邮件（假阳性），当用户的意见，他们可以提醒你在此，通过反馈表，您可以采取适当的行动，例如：调整你的过滤器。您还可以设置为“不是垃圾”，行政屏幕，这样可以节省时间反馈的意见。

垃圾评论，也有一个额外的选项卡管理的内容，上海管理»评论，被称为垃圾。这个标签允许你删除的意见和直接查看它们。

进球

内容已被过滤前开始与得分为0。一旦它通过垃圾邮件过滤器时，它就会被分配一个介于1和99分，1表示最有可能不是垃圾邮件，和99是指最有可能的垃圾邮件。数量实际上是一个概率，所以1是1％的垃圾邮件的机会，99是一个99％的垃圾邮件的机会。

每个过滤器的内容通过，被分配一个分数，乘以滤波器的增益 -过滤器，所以如果有一个250的增益，内容是一个介于0和250分。如果一个过滤器给出了0分，过滤器将被忽略。所有其他的分数相加，和应用的过滤器的所有收益加在一起，最后的比分是表示过滤得分总和/过滤收益的总和。

对于那些谁可以读取LaTeX的：

IsSpam_ {概率} = \压裂{\ sum_ {F = 1} ^ N {PERCENT \子弹增益}} {\ sum_ {F = 1} ^ N {获得}}

最后的比分，然后对垃圾邮件的阈值检查，并标记为垃圾邮件（大于或等于）或邮件（小）。

标记为垃圾邮件/非垃圾邮件

在每一个类型的垃圾邮件被检查的内容项的底部，有一个链接，说要么标记为垃圾邮件不是垃圾邮件标记为根据，对已标记的内容如何。的链接，让您迅速纠正，不是垃圾邮件（或“火腿”误报），或垃圾邮件的内容标记为垃圾邮件过滤器的工作。贝叶斯过滤器，特别是学习，更新内容项的得分，你手动纠正，从而降低了不正确的评估以后。

组态

垃圾邮件模块的配置发生在管理»网站配置»垃圾。在这里你可以设定哪些内容类型发送尽管垃圾邮件过滤器，以及它们是如何处理。

每个过滤器还可以提供一些详细的设置。

内容进行过滤

默认情况下，被过滤的意见。如果您有您的网站上公开发布，你可能要筛选那些内容类型。请记住，垃圾邮件处理略有增加服务器上的负载（在速度和数据库空间），所以没有过滤的内容，只有受信任的用户可以创建点。

您还可以过滤用户，但通常这是超过正常含量的问题，因为用户不必大量的文本匹配。使用用户配置文件可能会增加 - 也就是说，如果你有一个“关于我”框为每个用户，那些用伟哥可能是垃圾邮件。

行动

在这里，您决定内容标记为垃圾邮件的处理，以及消息发送给用户，如果他们的内容被标记为垃圾邮件。它肯定建议静静地防止垃圾邮件被张贴，直到你确信你的过滤器设置，运作良好。

高级配置

垃圾门槛：垃圾邮件的门槛决定前标记为垃圾邮件的内容，需要什么成绩。较高的得分，减少垃圾邮件会被逮住，得分越低，你的风险更多的误报。一个好的经验法则是可能离开它相当高（80-85）开始，然后逐步把它作为Bayesian过滤器开始学习什么是，什么是不适合你的网站。

日志级别：决定什么记录的信息量。

禁用不记录任何东西。
重要的（默认）提供有关的事情，不工作（错误）信息。
详细是非常有用的工作，什么样的收益水平，你的过滤器使用（我建议把调试级别和观看的意见，经过只是为了看看它是如何工作的。）
调试，主要用于开发，它肯定会产生很多比你关心的日志。

丢弃的垃圾邮件日志，年纪比：保持多久有关垃圾日志。

过滤器

过滤器概述

过滤器概述页面上，您会看到目前可用的过滤器，按重量排序。

过滤器的重量

Drupal中的其他地方一样，较低的重量（更负），表示过滤器浮动更高 - 这意味着，他们先前得到应用。

滤波器的增益

一个过滤器的增益变量决定过滤器将最后的得分上有多少影响。过滤器增益0没有任何效果（即它具有几乎相同的效果，禁用该过滤器在模块管理屏幕）。

具有较高的增益比其它过滤器的过滤器，有更多的最终得分影响。这可能是有用的，如果你找到了一个过滤器比别人更好的工作在您的网站上。

例如，当你开始训练Bayesian过滤器，你应该设置它的收益非常低的过滤器，将犯了很多错误。由于贝叶斯过滤器变得更加训练有素，从而更准确，你可以在过滤器上增加增益，决定给予其更多的整体垃圾邮件评分的影响。

贝叶斯过滤器

贝叶斯过滤器是在内容的统计分析，学习垃圾邮件和非垃圾邮件，它认为，以确定新的内容是或不是垃圾邮件的可能性。过滤出一无所知开始，到每一个错误的时间进行培训。这是通过标记为垃圾邮件的垃圾邮件内容在您的网站上，当你看到它。将记住每个字的垃圾邮件内容，并分配了一个垃圾邮件的概率。更多的时候一个字出现在垃圾邮件的内容，未来，用同一个词的内容也是垃圾邮件的概率更高。由于大部分垃圾评论包含链接到垃圾邮件发送者的网站（即以出售百忧解），贝叶斯过滤器提供了一个特殊的选项，快速学习和阻止包含已知的垃圾邮件网站的链接的内容。

自定义过滤器

自定义过滤器，黑名单，白名单或灰名单的基础上的单词，短语和正则表达式匹配。

例如，可以定义自定义过滤器始终标记为垃圾邮件的内容，如果它含有“伟哥”或“[URL ='字。

同样，自定义过滤器可以被定义，如果它匹配的情况下不敏感的正则表达式/ /我增加内容是垃圾邮件的概率。

URL过滤器

便携机过滤器是用来限制总数的意见及其他内容允许的URL，以及相同的URL，可以在相同的内容重复的次数。这些限制可以是不同意见和其他类型的内容。例如，如果模块被设置为只允许完全相同的URL出现在评论的两倍，如果在同样的评论http://kerneltrap.org/~~V节目三次或三次以上的评论将被视为垃圾邮件。

SURBL过滤器

SURBL过滤器是目前国内唯一的过滤器，使用第三方服务。SURBL过滤器内容项目的身体检查，通常发现在垃圾邮件的URL。

看到http://en.wikipedia.org/wiki/SURBL 或http://www.surbl.org详细信息。

节点年龄滤波器

节点的年龄过滤器，允许你指定的年龄节点，在几周内（从1到24），您认为旧的内容，真的老了内容。该过滤器，然后分配一个概率（60％至99％）等节点的意见是垃圾。

重复过滤

重复的过滤器可让您决定多少次相同的内容可以发布到网站 - 垃圾邮件发送者往往简单的剪切和粘贴的内容，所以这可能是一个好办法赶上他们。如果你选择2为阈值，那么每重复后的第一个将标记为垃圾邮件。

登录或注册以发表评论

简介

安装