Paul Graham Essays

返回

反击的过滤器

发布于 2003-11-16

原文:https://www.paulgraham.com/ffb.html

2003 年 8 月

我们或许可以通过让贝叶斯垃圾邮件过滤器跟踪链接来提高其准确性,看看链接的另一端有什么在等待。Richard Jowsey 来自 death2spam 现在在边缘案例中这样做,并称效果不错。

为什么只在边缘案例中这样做?为什么只做一次呢?

正如我在《Will Filters Kill Spam?》中提到的,跟踪垃圾邮件中的所有 URL 将产生有趣的效果。如果流行的电子邮件客户端为了过滤垃圾邮件而这样做,垃圾邮件发送者的服务器将遭受严重打击。我越想越觉得这是个好主意。这不仅仅是有趣;很难想象有什么比这更完美的对垃圾邮件发送者的反击。

因此,我想向那些致力于垃圾邮件过滤器的人提出一个额外的功能:一个 “惩罚” 模式,如果开启,将爬取怀疑垃圾邮件中每个 URL n 次,其中 n 可由用户设置。

正如许多人所指出的,当前电子邮件系统的问题之一是过于被动。它只会执行你告诉它的。迄今为止,解决这个问题的所有建议似乎都涉及新的协议。而这个建议不需要。

如果被广泛使用,自动检索垃圾邮件过滤器将使电子邮件系统 “反弹”。迄今为止对垃圾邮件发送者有利的大量垃圾邮件现在将对他产生负面影响,就像一根树枝弹回他的脸。自动检索垃圾邮件过滤器将使垃圾邮件发送者的成本上升,销售额下降:他的带宽使用量将飙升,他的服务器将在负载下崩溃,这将使他们对那些本来会回复垃圾邮件的人不可用。

每小时发送一百万封电子邮件,每小时在您的服务器上获得一百万次点击。

我们希望确保这仅适用于怀疑的垃圾邮件。通常,发送给数百万人的任何 URL 可能是垃圾邮件 URL,因此在几乎所有情况下,提交每封电子邮件中的每个 http 请求都将很好地运行。但也有一些情况不是这样:例如,从雅虎邮件和 Hotmail 等免费电子邮件服务发送的邮件底部的 URL。

为了保护这样的站点,并防止滥用,自动检索应与垃圾广告站点的黑名单结合使用。只有黑名单上的站点才会被爬取,而站点只有在被人类检查后才会被列入黑名单。垃圾邮件的生命周期至少应该有几个小时,因此应该很容易及时更新这样的列表以干扰促销新站点的垃圾邮件。

高容量自动检索仅适用于高带宽连接的用户,但这些用户足以给垃圾邮件发送者带来严重麻烦。实际上,这个解决方案巧妙地反映了问题。垃圾邮件的问题在于,为了接触到一些易受骗的人,垃圾邮件发送者向每个人发送邮件。不易受骗的收件人只是附带损失。但不易受骗的大多数人在可以阻止(或威胁阻止)易受骗者回应之前不会停止收到垃圾邮件。自动检索垃圾邮件过滤器为他们提供了一种方法来做到这一点。

这会杀死垃圾邮件吗?不完全。最大的垃圾邮件发送者可能可以保护他们的服务器免受自动检索过滤器的影响。然而,他们可以做到的最简单、最便宜的方法是在他们的邮件中包含有效的退订链接。这对于小鱼和雇佣垃圾邮件发送者促销的 “合法” 站点来说是必需的。因此,如果自动检索过滤器变得普遍,它们将变成自动退订过滤器。

在这种情况下,垃圾邮件将像操作系统崩溃、病毒和弹出窗口一样,成为只影响不费心使用正确软件的人的那些灾难。

感谢 Brian Burton、Bill Yerazunis、Dan Giffin、Eric Raymond 和 Richard Jowsey 阅读本文草稿。

FFB FAQ

日语翻译

最后编辑于 2024-04-15