基于黄河三角洲海洋地理信息数据仓库的数据挖掘与可视化技术研究
数据挖掘是在数据和数据库急剧膨胀的背景下,为解决“人们被数据淹没,但却饥饿于知识”这种困境而产生的,也是数据库技术、人工智能技术、统计技术、可视化技术等发展的结果,其目的就是从大量的、不完全的、有噪音的、模糊的数据中提取出隐含在其中的潜在有用的可信、新颖并能被人理解的信息和知识,它是一种高级的数据处理过程。在黄河三角洲的研究中,随着观测手段的飞速发展,海洋数据资料不断的增加,因此希望从大量的多源海洋地理信息数据中发现规律。为了充分利用数据带来的信息,作者设计开发了基于黄河三角洲海洋地理信息的实用化科研型数据挖掘系统(简称YRDDM)。
本文以黄河三角洲海洋地理信息数据流的先后顺序编排体系结构,依次为:数据管理、数据挖掘、可视化。首先建立元数据库、基础数据库,在此基础上构建数据仓库,将原始数据科学的管理起来;然后在数据仓库的基础上运用BP神经网络、SOM自组织神经网络、拟合分析、灰色系统、聚类分析、主成分分析(PCA)、SVD分析等数据挖掘算法对数据进行处理,以发现其中蕴涵的科学规律;最后将数据中包含的信息以可视化的形式表现出来,使人能够获得直观、形象、深刻和全面的理解。整个过程科学而又紧凑,各部分既分工明确、各尽其能,又互相联系、浑然一体。
本文在完成实现YRDDM的主要功能——各种数据挖掘方法的同时均给出相关的实例以展示系统的功能和发展应用的潜力:运用BP神经网络模型实现了黄河三角洲水下地形的恢复;运用SOM自组织网络模型实现了黄河三角洲遥感图片的地物分类;运用拟合模型对水深剖面进行了分析;运用灰色系统模型对黄河三角洲的面积进行了预测;运用聚类模型对渤海污染物站点进行了聚类分析;运用主成分分析模型对渤海污染物指数进行了评价;运用SVD模型对“973”黄河口实测的温、盐、悬浮体数据进行分析。此外作为YRDDM的重要组成部分的数据管理与可视化部分也均结合具体数据对其功能进行了详细的说明。
最后本文总结了系统的特点和存在的不足,指出了系统的发展前景和进一步研究开发的方向。
黄河三角洲;海洋地理信息;数据仓库;数据挖掘
中国海洋大学
硕士
地球探测与信息技术
孙效功
2005
中文
P208;P72;TP311.13
105
2006-07-27(万方平台首次上网日期,不代表论文的发表时间)