跳转到主要内容
一路上有亮 提交于 8 March 2012

原文链接:http://drupal.org/node/498092

 

这是垃圾邮件模块的文档页面。文件正在收集问题#455066:用法和API文档需要放在这里时,一节完成。

简介

目前垃圾邮件模块处理垃圾评论,节点和用户。垃圾邮件模块为Drupal其他垃圾邮件模块不同,作为一个独立的插件,不依赖于第三方为处理垃圾邮件(虽然一个可选的过滤器模块,通过垃圾API创建的任何其他过滤器模块以及)。你得到控制会发生什么,以及它是如何发生的。

安装

垃圾模块的安装很简单:

  1. 下载最新版本的垃圾,从项目的页面
  2. 提取它,并移到垃圾邮件文件夹目录的<drupal /网站/ /模块/或<drupal目录的/网站/默认/模块/
  3. 在你的网站,去管理»网站建设»模块,使垃圾邮件模块,和所有要使用的过滤器模块。
  4. 调整中的设置管理»网站配置»垃圾,你就大功告成了

使用垃圾邮件模块

新的内容可以通过启用垃圾邮件过滤器。这些过滤器分配一个介于0和99,在更高的分数意味着内容是更多的垃圾邮件得分。

得分相等或更大的垃圾邮件的阈值,然后标记为垃圾邮件,并根据您的配置,是未发表的,发送垃圾邮件队列,或删除。

标记为垃圾邮件的内容(节点,注释,用户)上显示的管理»内容管理»垃圾页面。从这里,你可以选择“标记为垃圾邮件”,将设置该项目的得分为零(和发布它,如果它是未发表的)。您还可以选择发布或取消发布的垃圾邮件。

反馈

“ 反馈 “选项卡允许您可以看到您的用户评论以及他们的论据,为什么它是不是垃圾。被错误地标记为垃圾邮件(假阳性),当用户的意见,他们可以提醒你在此,通过反馈表,您可以采取适当的行动,例如:调整你的过滤器。您还可以设置为“不是垃圾”,行政屏幕,这样可以节省时间反馈的意见。

评论

垃圾评论,也有一个额外的选项卡管理的内容,上海管理»评论,被称为垃圾。这个标签允许你删除的意见和直接查看它们。

进球

内容已被过滤前开始与得分为0。一旦它通过垃圾邮件过滤器时,它就会被分配一个介于1和99分,1表示最有可能不是垃圾邮件,和99是指最有可能的垃圾邮件。数量实际上是一个概率,所以1是1%的垃圾邮件的机会,99是一个99%的垃圾邮件的机会。

每个过滤器的内容通过,被分配一个分数,乘以滤波器的增益 -过滤器,所以如果有一个250的增益,内容是一个介于0和250分。如果一个过滤器给出了0分,过滤器将被忽略。所有其他的分数相加,和应用的过滤器的所有收益加在一起,最后的比分是表示过滤得分总和/过滤收益的总和

对于那些谁可以读取LaTeX的:

IsSpam_ {概率} = \压裂{\ sum_ {F = 1} ^ N {PERCENT \子弹增益}} {\ sum_ {F = 1} ^ N {获得}}

最后的比分,然后对垃圾邮件的阈值检查,并标记为垃圾邮件(大于或等于)或邮件(小)。

标记为垃圾邮件/非垃圾邮件

在每一个类型的垃圾邮件被检查的内容项的底部,有一个链接,说要么标记为垃圾邮件不是垃圾邮件标记为根据,对已标记的内容如何。的链接,让您迅速纠正,不是垃圾邮件(或“火腿”误报),或垃圾邮件的内容标记为垃圾邮件过滤器的工作。贝叶斯过滤器,特别是学习,更新内容项的得分,你手动纠正,从而降低了不正确的评估以后。

组态

垃圾邮件模块的配置发生在管理»网站配置»垃圾。在这里你可以设定哪些内容类型发送尽管垃圾邮件过滤器,以及它们是如何处理。

每个过滤器还可以提供一些详细的设置。

内容进行过滤

默认情况下,被过滤的意见。如果您有您的网站上公开发布,你可能要筛选那些内容类型。请记住,垃圾邮件处理略有增加服务器上的负载(在速度和数据库空间),所以没有过滤的内容,只有受信任的用户可以创建点。

您还可以过滤用户,但通常这是超过正常含量的问题,因为用户不必大量的文本匹配。使用用户配置文件可能会增加 - 也就是说,如果你有一个“关于我”框为每个用户,那些用伟哥可能是垃圾邮件。

行动

在这里,您决定内容标记为垃圾邮件的处理,以及消息发送给用户,如果他们的内容被标记为垃圾邮件。它肯定建议静静地防止垃圾邮件被张贴,直到你确信你的过滤器设置,运作良好。

高级配置

垃圾门槛:垃圾邮件的门槛决定前标记为垃圾邮件的内容,需要什么成绩。较高的得分,减少垃圾邮件会被逮住,得分越低,你的风险更多的误报。一个好的经验法则是可能离开它相当高(80-85)开始,然后逐步把它作为Bayesian过滤器开始学习什么是,什么是不适合你的网站。

日志级别:决定什么记录的信息量。

  • 禁用不记录任何东西。
  • 重要的(默认)提供有关的事情,不工作(错误)信息。
  • 详细是非常有用的工作,什么样的收益水平,你的过滤器使用(我建议把调试级别和观看的意见,经过只是为了看看它是如何工作的。)
  • 调试,主要用于开发,它肯定会产生很多比你关心的日志。

丢弃的垃圾邮件日志,年纪比:保持多久有关垃圾日志。

过滤器

过滤器概述

过滤器概述页面上,您会看到目前可用的过滤器,按重量排序。

过滤器的重量

Drupal中的其他地方一样,较低的重量(更负),表示过滤器浮动更高 - 这意味着,他们先前得到应用。

滤波器的增益

一个过滤器的增益变量决定过滤器将最后的得分上有多少影响。过滤器增益0没有任何效果(即它具有几乎相同的效果,禁用该过滤器在模块管理屏幕)。

具有较高的增益比其它过滤器的过滤器,有更多的最终得分影响。这可能是有用的,如果你找到了一个过滤器比别人更好的工作在您的网站上。

例如,当你开始训练Bayesian过滤器,你应该设置它的收益非常低的过滤器,将犯了很多错误。由于贝叶斯过滤器变得更加训练有素,从而更准确,你可以在过滤器上增加增益,决定给予其更多的整体垃圾邮件评分的影响。

贝叶斯过滤器

贝叶斯过滤器是在内容的统计分析,学习垃圾邮件和非垃圾邮件,它认为,以确定新的内容是或不是垃圾邮件的可能性。过滤出一无所知开始,到每一个错误的时间进行培训。这是通过标记为垃圾邮件的垃圾邮件内容在您的网站上,当你看到它。将记住每个字的垃圾邮件内容,并分配了一个垃圾邮件的概率。更多的时候一个字出现在垃圾邮件的内容,未来,用同一个词的内容也是垃圾邮件的概率更高。由于大部分垃圾评论包含链接到垃圾邮件发送者的网站(即以出售百忧解),贝叶斯过滤器提供了一个特殊的选项,快速学习和阻止包含已知的垃圾邮件网站的链接的内容。

自定义过滤器

自定义过滤器,黑名单,白名单或灰名单的基础上的单词,短语和正则表达式匹配。

例如,可以定义自定义过滤器始终标记为垃圾邮件的内容,如果它含有“伟哥”或“[URL ='字。

同样,自定义过滤器可以被定义,如果它匹配的情况下不敏感的正则表达式/ /我增加内容是垃圾邮件的概率。

URL过滤器

便携机过滤器是用来限制总数的意见及其他内容允许的URL,以及相同的URL,可以在相同的内容重复的次数。这些限制可以是不同意见和其他类型的内容。例如,如果模块被设置为只允许完全相同的URL出现在评论的两倍,如果在同样的评论http://kerneltrap.org/~~V节目三次或三次以上的评论将被视为垃圾邮件。

SURBL过滤器

SURBL过滤器是目前国内唯一的过滤器,使用第三方服务。SURBL过滤器内容项目的身体检查,通常发现在垃圾邮件的URL。

看到http://en.wikipedia.org/wiki/SURBL 或http://www.surbl.org详细信息。

节点年龄滤波器

节点的年龄过滤器,允许你指定的年龄节点,在几周内(从1到24),您认为旧的内容真的老了内容。该过滤器,然后分配一个概率(60%至99%)等节点的意见是垃圾。

重复过滤

重复的过滤器可让您决定多少次相同的内容可以发布到网站 - 垃圾邮件发送者往往简单的剪切和粘贴的内容,所以这可能是一个好办法赶上他们。如果你选择2为阈值,那么每重复后的第一个将标记为垃圾邮件。