学位专题

<
DOI:10.7666/d.y1928164

基于转导推理思想的一致性预测器

王莉
中国海洋大学
引用
当前存在的一些机器学习分类算法多是建立在归纳、演绎逻辑推理的方法基础之上,面对一批数据总是试图从中提取一个适用的通用分类模型,并期望此分类模型有较高的预测性能;但是这种分类模式在高风险、小样本领域却有一定的局限性:首先基于数量有限的小样本数据,用于归纳一个通用规则的训练样本数据较少,造成分类模型的准确度较低,而且忽略了测试集样本的信息,从而不能充分利用所有样本数据信息;其次分类预测结果通常只是简单的将样本划分为某一类,对样本多大程度上属于这一类没有一个量的概念,且预测结果没有置信度衡量,在高风险领域的应用尚有不足。   本文对基于转导推理的一致性预测算法的研究就是针对此局限性而展开的。转导推理是基于整个样本所拥有的全部信息直接进行分类识别的原则方法,分类过程中不需归纳分类模型,而是通过探索待测数据和样本序列之间的内在联系而进行推理判别;算法是通过Kolmogorov算法随机性理论建立一种置信度机制,通过随机性检测函数对置信度进行估算,且随机性检测函数的结果就是预测结果的可信度,同时在置信度控制下其算法预测结果是域的形式。   一致性预测算法的核心部分是非一致性度量函数的设计,设计非一致性度量函数可以融合现有分类算法进行。本文首先对k近邻一致性预测算法和支持向量机一致性预测算法进行研究,并在k近邻一致性预测算法的基础上进行改进,提出用测地线距离来代替欧式距离度量样本间相似性;然后基于逻辑回归模型实现了基于Logistic回归的一致性预测算法;本文所有算法都是基于MatlabR2007b平台实现,并基于多种标准数据集和实际应用领域的烟草行业数据进行仿真实验,同时和Weka平台下的一些分类算法的分类预测率进行比对分析,来验证一致性预测算法的性能。   本文最后对研究工作进行了总结,并指出了今后进一步的研究方向。

一致性预测器;转导推理;算法随机性理论;非一致性度量函数;测地线距离;Logistic回归分析;机器学习

中国海洋大学

硕士

信号与信息处理

丁香乾

2011

中文

TP181

70

2011-10-31(万方平台首次上网日期,不代表论文的发表时间)