学位专题

<
DOI:10.7666/d.y1503134

基于用户代理的POP3邮件过滤模型的研究

逄仁波
中国海洋大学
引用
随着计算机网络技术的发展与广泛应用,垃圾邮件问题日益严重,邮件过滤系统的研究和发展日益重要。 在邮件过滤系统的体系结构方面,MUA方式具有系统开销小,成本低,实现容易,维护方便等优点,但目前多数基于MUA方式的邮件过滤系统与邮件客户端紧密相连,无法实现邮件过滤系统相对于邮件客户端的独立性和透明性。 在邮件过滤方法方面,基于概率统计的方法具有准确率高和错误重现性小等优点,广泛应用于各种邮件过滤系统,但目前缺乏一种能够兼容各种基于概率统计方法的通用邮件过滤系统。 在邮件过滤系统的自学习方面,利用机器学习的方法训练和调整邮件过滤模型从而使邮件过滤系统更加完善的技术已被提出,但目前如何利用邮件客户端实现邮件过滤系统快速、有效地接受用户反馈并自动根据用户反馈对邮件过滤系统做出调整的技术尚未被提出。 基于上述研究背景和问题,本文提出了用户反馈自适应的POP3邮件过滤代理模型SAMFUF(Self-AdaptiveMailFilteringPOP3proxybasedonUsers'Feedback)。本文的主要工作和创新点如下: (1)采用overlappedI/O事件通信方式实现邮件客户端、邮件过滤系统和邮件服务器三者间通信以及线程池处理方式同时对多个邮件客户端进行邮件过滤等处理,实现了邮件过滤服务的高效率和稳定性,这是本文的主要工作,以下三点是本文的主要创新点。 (2)采用异步连接模拟同步连接方式建立邮件客户端和邮件服务器间POP3连接,实现了SAMFUF的透明性。 (3)将MaximumEntropy、Bayes、SVM等基于概率统计的方法从邮件过滤系统中独立出来,实现了SAMFUF的通用性。 (4)通过在邮件中插入包含邮件唯一标识、分类结果等信息的HTML表单的标签以及部署邮件过滤模型调整服务,实现了SAMFUF的自适应性。通过实验表明,SAMFUF在邮件过滤上具有较高的效率、准确率和通用性。

用户代理;POP3;邮件过滤

中国海洋大学

硕士

计算机软件与理论

徐建良

2009

中文

TP393.098

59

2009-09-28(万方平台首次上网日期,不代表论文的发表时间)