学位专题

<
DOI:10.7666/d.y1070787

图书借阅数据关联规则的挖掘

王朋朋
中国海洋大学
引用
随着现代社会的不断发展,知识更新速度的加快以及各个学科之间的关系日益紧密,社会对学生的知识面要求就越来越高。作为学生、教师与外界接触的窗口,高校图书馆显得尤为重要。它不仅方便教师、学生查阅文献,同时也是学生在课堂之外汲取知识的另外一个重要的场所。现在几乎所有的高校都采用数据库技术对图书馆进行管理,其主要目的是为了方便图书馆对图书的采购、编目及对图书的流通进行快速、有效的管理。在图书的流通过程中,产生了大量的数据,而学生借阅信息是其中最重要的数据之一。学生尤其是硕士研究尘和博士研究生的借阅书刊信息在一定程度上能够代表学科的发展方向和各学科之间的关联程度。本课题的目标就是从读者的大量借阅信息中挖掘出各学科之间的关联程度。 文章首先讨论了国内外数据挖掘的发展、应用情况以及关联规则的相关理论基础:然后根据图书馆借阅数据的特点进行数据预处理,包括数据的导入和提取,最终实现了事务数据库的建立;在此之后是基于Apriori算法及其改进算法FP-Growth的图书借阅数据关联规则的实现,并针对结果分析此课题的意义及两种算法的优缺点。文章最后是总结与展望。 通过对图书借阅数据关联规则的挖掘表明,程序语言类,网络浏览器类,国际互联网络类及图像识别及其装置类书籍同时被借阅的概率比较大,并且得出了两种算法在运行时间上的差异。实践证明,借阅数据关联规则的挖掘在高校图书馆数据库应用中具有一定应用前景。

数据挖掘;关联规则;图书馆数据库;数字图书馆;Apriori算法;FP-Growth算法

中国海洋大学

硕士

通信与信息系统

王怀阳

2007

中文

G250.76

62

2007-08-27(万方平台首次上网日期,不代表论文的发表时间)