基于Ontology的智能信息检索系统研究
当前Web拥有丰富的信息资源,已经成了人们获取信息的重要渠道。但是,由于Web页面的无结构性、半结构性、超链接的自由无序、以及Web内容的海量性、多样性和动态变化,使得人们从Web上获取真正想要的信息其实并不容易。传统的信息检索技术以关键字匹配为主,缺乏语义推理能力,对用户的查询请求也没有提供语义制导,因此造成信息的误检、漏检。因此如何提高Web信息的检索质量成为目前信息检索、数据挖掘和知识管理等研究领域的重要课题。
提高Web信息检索质量的根本方法是变无序数据为有序知识,让计算机理解Web信息的含义,从而实现语义检索。为此,Web创始人Tim Bemers-Lee于1998年提出了Semantic Web(语义Web)的构想,它是当前Web的扩展,其中的信息被赋予定义良好的(well-defined)含义,使计算机可以理解,从而和人更好的协作。而Ontology为Web信息提供了语义表示机制,是实现语义Web的关键技术。
本文分析了传统Web信息检索技术存在的问题与不足,深入研究了Ontology的概念、建模元语、描述语言、构建方法、构建工具,并重点分析了OWL的语义表达能力,以此为基础提出了基于Ontology的智能信息检索系统的框架,阐述了系统的功能和实现机制。
本文深入研究了智能信息检索系统涉及到的关键技术,提出了有效的解决方案,为原型系统的开发提供了理论支持。关键技术主要包括:Ontology的构建技术、Ontology的存储技术以及基于Ontology的信息检索策略。
本文设计实现了基于Ontology的智能文献检索原型系统PaperSearch。在该系统中,构建了计算机学科的领域Ontology和文献Ontology。PaperSearch提供面向专业的检索服务,检索方式灵活多样,能够对用户提供语义制导,有较强的推理能力,实现了基于知识的语义检索。实验证明,该系统能提高信息检索的质量和效率,从而验证了理论的正确性。
Ontology;语义Web;语义检索;智能信息检索
中国海洋大学
硕士
计算机应用技术
姚文琳
2006
中文
G354.4
85
2007-08-07(万方平台首次上网日期,不代表论文的发表时间)