【问题标题】:Spamassassin, sa-learn with subdirectoriesSpamassassin,带有子目录的 sa-learn
【发布时间】:2016-12-05 12:27:54
【问题描述】:

我很难找到一个好的解决方案来设置 Spamassassing (sa-learn) 以通过来自子目录的电子邮件进行学习。

我阅读了很多教程。在每个教程中都是这样的:

/usr/bin/sa-learn --no-sync --ham /var/vmail/*/*/Maildir/{cur}
/usr/bin/sa-learn --no-sync --spam /var/vmail/*/*/Maildir/.Junk/{cur,new}

就是这样。

我只是像这样尝试了自己的方式:

/usr/bin/sa-learn --no-sync --ham /var/vmail/*/*/Maildir/.*/{cur,new}
/usr/bin/sa-learn --no-sync --ham /var/vmail/*/*/Maildir/{cur}
/usr/bin/sa-learn --no-sync --spam /var/vmail/*/*/Maildir/.Junk/{cur,new}
/usr/bin/sa-learn --forget /var/vmail/*/*/Maildir/.Trash/{cur,new}
/usr/bin/sa-learn --sync

首先,我说所有由用户创建的目录,都包含这些目录。 在那之后,我对垃圾邮件说 .Junk 是垃圾邮件的位置。 第三步,忘记垃圾箱。 并同步。

电子邮件帐户示例:

.Draft
.Junk
.Trash
.Important
.Important.Others
.Important.Others.Others
cur
new

谢谢你的帮助!!

最好的问候

【问题讨论】:

  • 你的尝试在什么方面不起作用?
  • 我的方法奏效了。但这是正确的方法吗?因为首先脚本将所有电子邮件标记为 ham(还有在之前运行中已标记为垃圾邮件的电子邮件)。之后,脚本会将 .Junk 目录中的电子邮件标记为垃圾邮件。最后,我没有一个强大的统计数据。 (因为删除标记为垃圾邮件和新添加的垃圾邮件标记)我认为有更好的方法

标签: spam-prevention spamassassin


【解决方案1】:
  1. 您也应该选择是否要在 new 文件夹上学习。我没有,因为这些文件夹可能包含误报和误报。当电子邮件在我的cur 文件夹中时,我已阅读它并将其放置在正确的文件夹中(火腿或垃圾邮件)。

  2. 为什么您将电子邮件忘记在垃圾箱中?这取决于你如何使用你的垃圾。在我的工作流程中,只有火腿会被扔进垃圾桶。所以你不妨使用这些数据来学习分类器。

  3. --forget 调用中使用--no-sync 可能会加快速度。

【讨论】:

    【解决方案2】:

    是否有必要将所有电子邮件都学习为 HAM ?您认为此文件夹中没有垃圾邮件?使用您的第一个命令,您可能会认为垃圾邮件是不正常的?

    为什么不只从垃圾文件夹中学习垃圾邮件?

    【讨论】:

    • 是的,你也需要学习火腿。否则,SpamAssassin 将不知道 ham 是什么样的,所以最后它会将所有内容都归类为垃圾邮件,并认为它已经构建了一个 1.0 分的分类器。但是,他不应该在 new 文件夹上进行培训。看我的回答。
    猜你喜欢
    • 1970-01-01
    • 2018-04-29
    • 2023-04-01
    • 2012-09-09
    • 2014-02-15
    • 2016-11-28
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    相关资源
    最近更新 更多