对抗TrackBack Spam思索
2006-11-27
一个星期前发现狐客TrackBack收到大量Spam信息,单篇日志TrackBack高达上千条。
对数据库中垃圾信息做删除后,临时关闭全站TrackBack功能。
在设计狐客时考虑到容易受到Spam干扰,TrackBack验证串采用MD5加密,防止恶意猜解。
然而现在的Spamer技术水平越来越高,利用网络蜘蛛技术自动抓取不同页面的TrackBack URL
在没有解决Spam问题之前“狐客”暂时关闭全站TrackBack功能。
以下是我的几种解决方案:
1、每个用户在收到spam的trackback后可能会去删除,在删除操作时系统自动记录这条spam对应的ip地址,然后对spamIP进行数量上的分级,比如有10个用户(或者10次)提交了一个IP地址的spam,那么就认为这个ip是纯粹的危害性大的spam来源,直接整站屏蔽这条IP地址,不够10条的那就只在提交此IP的用户范围内进行过滤即可。这种方式估计是最有人情味和误判率最低的人肉过滤。想要更高级的,那就全世界范围内建立一个spam字典库吧,通过信任登记的用户可以向该库提交spam数据,全球任何用户都可以从该库提出spam数据以供己用。
(该方案适合流量比较高的BSP,并不适合“狐客”)
2、对来源URL和TrackBack内容以及IP低值进行关键字过滤。查询google得知,目前全世界的TrackBack Spam也就那么几个,对这些站点做过滤是比较高效率的办法。很怕有一天中国人突然学会了TrackBack Spam
(该方案比较适合目前国内情况,以及“狐客”情况)


评论
但也不好一直就这么关闭吧。。。