基于SilAlign的中文语音文语对齐的研究-学位-万方数据知识服务平台

HEADERS

搜索

声明
论文说明
摘要
英文摘要
目录
1 引言
1．1 语音识别发展历史
1．2 语音识别系统介绍
1．3 文语对齐的特点和研究现状
1．4 本文研究的主要内容
1．5 本文的组织结构
2 基本原理和工具介绍
2．1 HMM
2．1．1 马尔科夫过程
2．1．2 隐马尔可夫模型
2．1．3 HMM基本要素及三个问题
2．2 HTK
2．3 本章小结
3 各对应率下文语对齐的实验分析
3．1 SailAlign
3．1．1 编辑距离
3．1．2 SailAlign介绍
3．1．3 SailAlign算法
3．2 实验结果和数据分析
3．3 本章小结
4 自动化的文语对齐
4．1 文本与语音的预处理
4．2 SailAlign的文语对齐
4．3 文本的抽取和语音的切分
4．4 自动化文语对齐
4．5 本章小结
5 总结与展望
5．1 本文的主要工作
5．2 对未来工作的展望
参考文献
致谢
个人简历

基于SilAlign的中文语音文语对齐的研究

高红坤

中国海洋大学

在线阅读下载

引用

打印

摘要：文语对齐是以语音识别器为基础，在时间上对语音和文本进行强制对齐的过程。文语对齐通常被应用在多媒体检索和训练一个大词汇量的语音识别和合成系统。近年来网络上可以获取越来越丰富的音频资源，促进了语音和文本对齐的大规模研究。例如有声书本，多媒体文档等。对这些语音和文本，采用传统的基于维特比的强制对齐算法被证明对于文本和语音不匹配或者语音存在噪声的情况存在不足。　　为了使语音和文本能够避开这些限制，使用语音识别器对原始的语音进行识别，从而得到含有时间信息的识别文本，再把该文本与原始文本进行对齐，来得到两者共同的部分。这样就把语音和文本的对齐问题转化成为文本和文本的对齐问题，后一种问题的解决方案通常要求的计算量要少得多。SailAlign这一开源工具就是基于这种语音和文本对齐方法。　　本论文利用修改的SailAlign算法进行中文的文语对齐研究。在语音多于文本的情况下，我们进行了实验，并对其结果进行分析。最后我们还实现了自动化的文语对齐。　　本文的主要研究工作如下:　　首先，由于SailAlign算法不支持中文，所以我们修改了SailAlign...

关键词：

中文语音文语对齐过程 SailAlign算法语音识别器

授予学位：

硕士

学科专业：

电子与通信工程

导师姓名：

张巍

学位年度：

2015

语种：

中文

分类号：

TN912.34(通信)

在线出版日期：

2016-01-27 （万方平台首次上网日期，不代表论文的发表时间）

FOOTERS