基于英汉双语语料库的英汉双语Ontology的建立与管理
随着Internet的迅猛发展,信息技术面临的种种挑战促成了建立Ontology的热浪。通常,一个成熟本体的建立除了需要领域专家的参与外,还需要遵循Ontology的一系列构造准则和评估标准,成本十分高昂,其效果也不尽人意。
目前,国外已建立了许多比较成熟的英语Ontology,国内也已有了比较完善的英汉双语语料库,现在完全可以利用这些已经成熟的资源来建立为我们自己所用的英汉Ontology。
本文基于英汉双语语料库,实现了一种将英语Ontology转化为我们自己所用的英汉双语Ontology的方法,使我们能够以较低的代价获得比较成熟的英汉双语Ontology,这必将带动我国Ontology建设乃至其相关领域的飞跃发展。
第一章介绍Ontology和双语语料库以及本课题的研究背景和研究目的。
第二章介绍Ontology的一些重要概念,包括Ontology的定义、分类、应用、构建方法、开发支撑工具以及描述语言。
第三章介绍语料库和双语语料库的概念及各种句子、短语对齐技术,首先回顾语料库的发展背景,然后比较双语语料库的各种句子、短语对齐技术的优缺点,在此基础上引入本人对英汉双语语料库中短语对齐的改进工作,并利用四种常见的数学模型建立了最优翻译等价对库。
第四章 给出基于英汉双语语料库的英汉双语Ontology的实现。利用最优翻译等价对库,采用Jena解析RDF描述的英文Ontology,用java语言实现英文Ontology转换为英汉Ontology。
第五章 从实现方法的创新性、局限性及可以进一步开展的工作等方面做一简单总结和展望。
双语语料库;英语;汉语
中国海洋大学
硕士
计算机应用技术
徐建良
2006
中文
TP39
61
2007-08-07(万方平台首次上网日期,不代表论文的发表时间)