在原本的垃圾评论过滤系统被广泛吐槽之时,多说其实早就着手开发新一代的垃圾评论过滤系统。早在7月末,新的系统就已经上线试运行,上线之后那个烦人的“呵呵”和大部分的色情评论都不见了。从那天到现在,过滤系统的服务有过多次暂停,重启,调试等等。但都已经在最快的时间内调整并恢复了。

事实上,现在的过滤系统几乎重写了原来的版本,采用了全新的算法对评论的数据进行处理。从数据库训练的结果与目前实际后台处理的结果来看,统计意义下的效果还是很好的,相比之前是有明显进步。鉴于最大化的信任用户评论,过滤系统对垃圾评论的定义放的比较宽,这使得经过系统的评论被分为三类,分别是已通过、待审核和垃圾;其中待审核部分是由于各个网站性质不同,而被系统看做的疑似垃圾。但是这里不得不强调的是,只有网站主在自己的多说管理后台选择了“默认审核通过”这个选项,我们的垃圾自动过滤功能才好用,否则每一条都需要手动审核。

尽管目前的系统谈不上完美,会有部分的垃圾评论未被过滤,以及有少数正常评论被标记为垃圾。但是我们有足够的信心让他变得越来越好。也欢迎大家对目前的系统提出改进意见。