话说以前用Wordpress的时候不觉得,因为了强大的akismet.在放弃使用WP后,才知道垃圾评论的可怕之处。
拿我的博客来说吧,每天至少有15来条垃圾评论(我的博客正规评论几天都收不到一条 囧),怎么判断一个评论是否为SPAM就很是个问题。
看了下Akismet的代码后,不想用它读取服务器数据的方式来判断是否为SPAM。于是观察了下所有的垃圾评论,发现他们都有很多共同点。
一、大多数SPAM都是纯粹的英文,找不到一个汉字,而且这种SPAM的长度都很长。
二、如果一个评论包含了大量的链接信息,那么不用怀疑,这肯定是一个SPAM。
三、判断来路,如果一个评论的发出的REFFER不是本站,那么这是一个SPAM.
四、如果评论中有引用其他评论或者回复某条评论,那么,这条评论绝大多数是个正常的评论,不是SPAM
五、长度过长的评论大多数情况下是SPAM。
恩,总共就总结出了这么几条,不过基本上够用了。当然,其中有几条只适合中文网站,呵呵。