基于马尔可夫随机场算法的水下图像深度提取
计算机视觉主要是用以研究应用计算机来模拟人类和生物的视觉系统功能的技术学科。它的研究目标,是使计算机能具有通过一幅或多幅2D图像认知3D场景信息的能力,即用计算机实现对客观世界三维场景的感知、理解和识别。计算机视觉既是工程领域,更是科学领域中的一个富有挑战性的研究领域。 许多计算机视觉算法容易忽略图像底层的三维几何结构,这就限制了这些算法的发展及应用。本文介绍的算法,通过对基于外观匹配的几何模型类的学习,来达到杂乱密集的自然场景中单个场景的特性进行几何属性的粗略估计。相对于相机而言,几何类描述了图像区域的三维定位。本文提供了一种具有多种假设的框架,该框架可以实现基于一张图片的健壮的场景结构估计,并且为每一个几何结构的标签增加确信度。这些值得确信的标签也可以被应用于许多其他功能中的效果增强。 本文简要介绍了深度提取技术的发展现状,算法原理和技术指标,并且在此基础上,对“基于马尔可夫随机场算法的水下图像三维重建算法”这一重点内容进行了详细的论述。 本文重点研究了使用马尔可夫随机场(MRF)建立单目视觉模型的线索和图像中各部分之间的关系。以往的提取水下图像的深度信息的方法特点是条件充分,从而得到的深度信息较为准确,缺点是需要专门的仪器和复杂的参数调整。本文论述的基于马尔可夫随机场的水下深度信息提取的方法克服了以上的难题,并且已经被应用于各种不同的问题中,在这些提取过程中,往往会出现信息存在局部特征不足的情况中,这就需要很多上下周围环境关联的信息来分析图像特征。这种方法具有很好的可行性,较低的成本,是一种重负荷的机器学习的方法,并且可以提高水下深度信息的准确度。另外,这种方法也可以很好地应用在有立体观测,图像分割和对象分类等操作中。 本文首先介绍了模式识别的基本理论。然后介绍了水下图像的特征提取的特点和困难,而后引入基于马尔可夫随机场算法的水下图像深度信息提取的原理方法。 考虑到本文的任务是从一个单目图像来进行深度估计,本文采取的是监督学习方法来研究这一问题。本文的实验过程是:首先收集一组训练的单目单幅的水下图像,以及与之相对应的真实深度信息;然后,将监督学习中应用预测深度的映射关系作为图像深度预测的函数。由于仅仅从图像内部的某一点的特性来估计深度是低效的,这也造成了单目图像的深度估计成为了一项具有挑战性的难题,该实验不仅仅需要考虑图像的各个区域的深度,也需要考虑图像中全局的上下关联。本文使用一个有区别训练的马尔可夫随机场(MRF)模型,其中包含了在多尺度规模上的局部和全局特性,也包含了不同的点之间的深度联系。结果表明,即使在非结构化场景中,该算法也是恢复精确深度映射的准确率较高的算法。 对图像中的每一个均匀的图像块来说,本文使用一个马尔可夫随机场来推断的一组“平面参数”来获取每个图像块的空间位置和空间方向。马尔可夫随机场,通过有监督的学,来实现对图像的深度线索和图像中不同区域的关系的建模。除了假设照片上的环境是由大量的小平面组中的,该模型没有明确地假定场景的具体结构。修改算法使得本文的算法可以获取相较于先前的技术而言更为详细的三维结构。并且,通过图像的渲染,该算法可以输出一个更加丰富的漫游式的3D效果,该算法甚至在没有明显的垂直结构的场景中仍然有效。 使用该算法,已经成功在120张图片的其中70张中定性地创建了正确的3D模型。基于马尔可夫随机场算法的水下图像深度提取方法具有成本低和使用方便的特点,具有很好的应用前景。
水下图像;深度提取;马尔可夫随机场算法;模式识别
中国海洋大学
硕士
电子与通信工程
郑冰
2014
中文
O211.6;TP391.41
68
2015-04-01(万方平台首次上网日期,不代表论文的发表时间)