学位专题

<
DOI:10.7666/d.y1337441

关联规则挖掘在图书借阅数据处理中的应用

吕志芳
中国海洋大学
引用
高校图书馆作为高校师生的一个重要知识库,馆内藏书所涉及的领域非常广泛;图书馆每年购入新书,因此图书馆藏书量也在不断增多。师生们要在众多的书籍中找到自己需要的相关图书是一件非常困难的事情。因此,快速有效地优化藏书布局对师生的学习与研究显得尤为重要。本课题的目标就是运用数据挖掘中的关联规则方法,从读者的历史借阅数据中快速有效地挖掘出借阅书籍之间的关联信息,来帮助管理员优化藏书布局。 本文首先阐述了数据挖掘的理论基础,对关联规则数据挖掘中的一些经典算法进行了系统的分析和总结;然后根据要求将图书馆历史借阅数据进行数据预处理,包括数据的导入和提取、事务数据库的建立;在此基础上将新的关联规则挖掘算法MFP-Miner算法运用到事务数据库,挖掘出借阅书籍之间的关联规则。实验结果显示,该算法在效率上优于其它算法。 由于图书馆借阅数据每日有更新,数据库不断增大,并且根据需要的关联程度不同,最小支持度也有变化。为了使图书摆放能够尽快适应师生借阅需求,需要不断地更新挖掘结果。若利用前面的挖掘算法(如MFP-Miner等)重新挖掘整个数据库,将会很费时间,而且以前挖掘出来的信息也被浪费。为此,本文提出运用MFIA-IU算法来解决数据库和最小支持度同时变化时的综合更新挖掘最大频繁项目集的问题,从而可避免每年对旧数据的重复挖掘。

关联规则挖掘;数据挖掘;图书借阅;数据处理;挖掘算法

中国海洋大学

硕士

信号与信息处理

王怀阳

2008

中文

TP311.131

78

2008-12-08(万方平台首次上网日期,不代表论文的发表时间)