浅谈对评论是否为SPAM的判断

话说以前用Wordpress的时候不觉得,因为了强大的akismet.在放弃使用WP后,才知道垃圾评论的可怕之处。

拿我的博客来说吧,每天至少有15来条垃圾评论(我的博客正规评论几天都收不到一条 囧),怎么判断一个评论是否为SPAM就很是个问题。

看了下Akismet的代码后,不想用它读取服务器数据的方式来判断是否为SPAM。于是观察了下所有的垃圾评论,发现他们都有很多共同点。

一、大多数SPAM都是纯粹的英文,找不到一个汉字,而且这种SPAM的长度都很长。

二、如果一个评论包含了大量的链接信息,那么不用怀疑,这肯定是一个SPAM。

三、判断来路,如果一个评论的发出的REFFER不是本站,那么这是一个SPAM.

四、如果评论中有引用其他评论或者回复某条评论,那么,这条评论绝大多数是个正常的评论,不是SPAM

五、长度过长的评论大多数情况下是SPAM。

恩,总共就总结出了这么几条,不过基本上够用了。当然,其中有几条只适合中文网站,呵呵。

“浅谈对评论是否为SPAM的判断”   1 comments

Leave a comment:

XHTML: You can use these tags: <a href="" title=""> <b> <blockquote cite=""> <em> <i> <strong> <p> <br><br />