学位专题

<
DOI:10.7666/d.y988632

说话人识别技术研究及其在医院导医平台中的应用

吴槟
中国海洋大学
引用
本文对说话人识别技术在医院导医平台中的应用作了较为深入的研究。作为一种方便实用的基于生物特征的身份确认技术,目前的说话人识别系统对纯净语音已经可以达到很高的识别精度,但在实际环境中无处不在的噪声带来了训练模型和测试语音之间的失配,使得噪声环境中说话人识别系统的识别率急剧下降。因此抗噪声技术的研究是说话人识别系统在医院噪声环境中投入实用的关键。 本文首先分析了医院噪声的主要来源和种类,提出了根据噪声的组成成分的不同而将医院噪声分为三个不同的工作时段,并建立了噪声环境中的说话人识别数据库。针对当前存在的不同的语音建模方法,通过实验的方法对各种分类模型进行了比较,通过对比各种模型之间识别效果的优劣和对噪声的鲁棒性,最终确定了采用识别率较高且在噪声环境的下降幅度最小的GMM-nV模型作为系统的基本模型。 针对噪声所带来的信号空间、特征空间和模型空间的失配,我们需要将多种方法融合共同作用。为此,在特征空间我们详细研究了倒谱均值归一化等谱变量补偿方法;在模型空间我们提出了基于不同时段的直接倒谱加权的GMM,并根据医院不同时段的噪音种类和对数似然误差准则,评价各MFCC倒谱分量的平均贡献,根据各维特征的鉴别能力确定加权窗函数的形式。此外,我们又提出了最大化识别标准和段间联合识别标准用于医院环境中的应用,进一步提高了系统的识别效果。 由于医院在不同的工作时段其噪声的组成成分和噪声种类并不相同,为了保证各个时段的识别都有较好的识别率,我们决定针对医院不同时段的噪声情况采用不同的识别方案。通过对多种融合方案的研究和对比参照实验,最终我们结合医院带噪声语音数据库确定了针对医院不同时段的说话人识别方案的形式。实验结果表明,本文所采用的方法可以显著提高系统在医院噪声环境下的识别率。

说话人识别;直接倒谱加权;导医平台;身份确认;抗噪声技术

中国海洋大学

硕士

计算机应用技术

董军宇

2006

中文

TN912.34

77

2007-08-07(万方平台首次上网日期,不代表论文的发表时间)