学位专题

<
DOI:10.7666/d.y1503127

基于依存语法的汉语句法分析研究

高玲玲
中国海洋大学
引用
句法分析是自然语言处理基础研究中的一个关键技术之一,是衔接词法分析与语义分析的桥梁。本文的目的是从汉语自身特点出发,以现有的句法分析理论和方法为指导,研究和开发适合汉语的句法分析技术。 句法分析技术指的是依据语法规则来确定句子结构的分析方法。依存语法是当今句法学研究的前沿和热点问题之一,本文的句法分析采用的语法体系就是依存语法,采用的句法分析技术是决策式依存句法分析方法。Niver算法作为决策式句法分析方法已经成功的应用于英文的依存句法分析,因为英文和中文在句法特点上具有一定的相似性,所以本文采用Nivre算法进行汉语依存句法分析。 本文首先对现有的一些依存句法分析方法从处理策略,算法的时间复杂度等方面进行了综合分析和比较,其中详细研究了Nivre算法,然后针对该算法,本文提出了进一步的改进。Nivre算法在分析长距离右依存时会出现错误,在汉语中,只有动词和介词跟他们的依存者具有右依存关系,所以错误主要发生在动词和介词的依存分析上。本文依据汉语介词短语的特点,提出了一种改进的Nivre算法,让除了介词外的介词短语部分先进行依存分析,最后再是跟介词之间的依存分析,来减少介词的长距离依存问题,提高汉语依存句法分析的正确率。 实验数据采用含有1万个句子的哈尔滨工业大学的依存关系语料库,采用基于支持向量机(SVM)的句法分析器MaltParser作为本文算法的实现工具。结果表明,使用改进后的Niver算法进行汉语依存句法分析,正确率提高了1.72%,对介词的长距离依存取得了比较好的分析结果。

依存语法;汉语;句法分析;支持向量机

中国海洋大学

硕士

计算机软件与理论

姚文琳

2009

中文

TP181;H146.3

52

2009-09-28(万方平台首次上网日期,不代表论文的发表时间)