将SpamAssassin与我的PHP应用程序集成

时间:2015-08-27 04:15:03

标签: php spam spamassassin

我使用PHP构建了一个Web应用程序,其中包含一些帖子,其中包含来自Instagram的“pizza”等关键字,并将其他一些数据加载到MongoDB中。

其中一个模块是Python的NLTK,这是​​我如何调用它(是的,我正在将语言切换为疯狂[只是为了研究它们]):

$foo = exec("python tokenize.py $bar");

现在上面的一行完全正常,但我正在寻找一种类似的方式来调用我的SpamAssassin来检查Instagram帖子的内容是否是垃圾邮件。从SA的文档来看,我知道可以检查一些纯文本文件,因为它们是邮件like here。我是SA的新手。

对于高级SA用户来说,这个问题可能非常简单,但是我不能像在上面的PHP-to-Python调用中那样从cmd告诉SA中的任何输入输出选项。假设$string是Instagram帖子的内容,我正在寻找类似的脚本:

$score_of_SA = exec("spamassassin.exe $string")

在PHP中可以使用这样的脚本吗?如果没有,我该怎么做才能检查内容?

假设我的SA已更新并经过培训。

1 个答案:

答案 0 :(得分:1)

疑。 Spamassassin不是通用文本检查程序,它通过查看各种已知的电子邮件相关因素(如发送服务器是否具有有效的MX记录或SPF或DKIM消息)从源电子邮件构建其分数。

这些都与非电子邮件结构无关。文本分析的核心组件之一是贝叶斯过滤器的实现。

然而有希望!并且该解决方案更加集成到PHP项目中。碰巧在Packagist中有一个php贝叶斯垃圾邮件过滤器库:See here

您必须训练垃圾邮件过滤器,此库也不例外。