学位专题

<
DOI:10.7666/d.y989366

基于本体的信息检索研究

王雨英
中国海洋大学
引用
如今,万维网已成为人们获取知识的主要来源,但由于Web页面的无结构性、超链接的自由无序、及其内容的海量性、多样性和动态变化,信息资源缺少统一的语义描述,使得用户难以查找到与需求相关的资源,即所谓“rich data,poor information”。 语义万维网(Semantic Web)是万维网的发明人Tim Berners-Lee倡导的下一代万维网,旨在赋予万维网上所有资源唯一的标识,并在资源之间建立起机器可处理的各类语义联系。语义万维网是对当代万维网的扩展和延伸,能够提高异构系统之间的互操作性,促进知识共享。 为了将目前无序的Web改造成有序的计算机可理解的知识宝库,语义Web采用多层次的表示框架,本体位于从文档描述到知识推理转折的层次,因此本体的构建是实现语义Web的关键环节。 本体就是用来描述某个领域(领域本体)甚至更广范围(通用本体)内的概念以及概念之间的联系,使得这些概念和联系在共享的范围内有着明确唯一的定义,达成一种共识,这样人和机器之间就可以进行交流。 20世纪90年代初,基于AI的本体描述语言被提出,有代表性的如KIF、ontolingua、Loom、OCML、FLogic等。其中,KIF是基于一阶逻辑的,Ontolingua、OCML和Flogic是基于框架和一阶逻辑的,而Loom是基于描述逻辑的。随着Web的发展,出现了一系列基于Web的Ontology表示语言,如SHOE、XOL、RDF(S)、OIL、OIL+DAML、OWL。Web应用需通用的标准语言来表示,W3C先后推荐了RDF(S)、DAML+OIL和OWL作为本体描述语言标准。 本体建设的方法已经成为一个新的研究热点,在本体建设项目的实践中产生了一些方法。由于学科领域不同,具体的应用也不同,出于对各自问题域和具体工程的考虑,其建设过程也各不相同。目前几种常见的本体建设方法有IDEF-5法、骨架法、企业建模法、METHONTOLOGY和循环获取法。 本文在最后利用Protégé3.1.1建立了一个关于科技论文的本体,给出本体的具体结构:类(Class)、属性(Property),设计了几个查询需求,并用Jena-2.2 API实现基于该本体的信息查询实例,给出查询结果,并进行比较。 该查询支持语义查询,即不但能检索出在语法形式上和查询条件相一致的结果,而且能检索出在语义上和查询条件相符的结果,提高了检索质量,有效保障检索结果的相关性。这里的语义关系主要包括同义关系、近义关系,验证了基于本体(语义层次)的信息查询优于传统的基于关键字的查询。

语义网;本体;信息检索

中国海洋大学

硕士

计算机技术

姚文琳

2006

中文

TP311;TP391

57

2007-08-07(万方平台首次上网日期,不代表论文的发表时间)