P2P环境下基于Ontology的搜索引擎
搜索引擎是Internet迅猛发展的产物。它的出现使信息检索变得非常方便。但是,随着Internet以及随后出现的WWW技术的不断发展,导致网络所蕴涵的信息量急剧地膨胀。面对当前如此庞大的信息数据,目前普遍采用的是基于中心服务器的传统搜索引擎,所以在实际应用过程中很难准确、有效、快速地查找用户所需的信息。因此,搜索引擎技术急需进一步的发展和完善来适应新形势的变化。
本文主要探讨了采用新的信息检索模型—P2P分布式检索模型,来增加搜索引擎系统的规模并改善了它的性能。论文首先分析了传统的搜索引擎的关键技术、发展趋势和面临的挑战,由此引出将先进的P2P理念与传统的搜索引擎技术相结合的新方法,顺应了搜索引擎技术趋向分布式、本地化方向发展的趋势。采用这种新的基于P2P分布式的搜索模型构建的搜索引擎系统,与现有的基于“网络蜘蛛”的搜索引擎相比较,在搜索到的信息的即时性、搜索到的内容的深度、搜索到的内容的范围广度以及搜索到的结果的精度和效率方面都有较大的改善空间。在提高查询准确率方面,利用目前发展较快的Ontology技术来改善。在传统的搜索引擎设计思想下吸收两者的优点,为提高搜索引擎的性能提出了一个可行的方案。
在本论文的设计中,针对当前的各个P2P系统的不能相互兼容的问题,采用Sun公司的新一代通用P2P开发平台JXTA,并在此基础上构建了基本的P2P搜索网络,定义了位于搜索网络之上的基于JXTA的搜索引擎系统所需要的服务规范以及实现,构建了一种具有高度扩展性的本地化搜索引擎系统模型,同时也为有效的提高搜索引擎系统的规模和性能探讨了一条可行之道。
P2P搜索引擎的研究在国内外尚处在理论探讨阶段,目前并没有较为成熟的商业应用。而OntO10gy技术也是下一代互联网一语义Web的主要技术,也正处于探索阶段。本文提出的基于JXTA的P2P分布式搜索模型,借助Ontology的语义表达优势构建搜索引擎系统的方法,为今后设计和开发具有较高实用价值的搜索引擎系统进行了实际意义上的探讨。
对等网络;搜索引擎;信息检索
中国海洋大学
硕士
计算机应用技术
徐建良
2006
中文
TP3
59
2007-08-07(万方平台首次上网日期,不代表论文的发表时间)