数据挖掘分类技术及其在击剑负荷分析中的应用
随着数据库技术的成熟和数据应用的普及,人类积累的数据量正在以指数的速度增长,人们面临着快速扩张的数据海洋,数据洪水正以扑面之势向人们滚滚涌来.与日趋成熟的数据管理技术相比,人们所依赖的数据分析工具无法有效地为决策者提供其决策支持所需要的相关知识,从而形成了“丰富的数据,贫乏的知识”之独特的现象。正是为了解决这种数据丰富而知识贫乏的矛盾,数据挖掘技术应运而生。
分类在数据挖掘中是一项非常重要的任务,其目的是学会一个分类函数或分类模型,该模型能把数据库中的数据项映射到给定类别中的某一个,目前在商业上应用最多。挖掘分类模式的方法有多种,如决策树方法、贝叶斯信念网络、基于关联的分类方法、遗传算法、K-最临近方法、神经网络等等。
本文首先介绍了分类的定义、步骤、分类器构造方法等,然后详细介绍了其中最常用的两种技术:决策树技术和人工神经网络技术。常见的决策树生成算法有基于信息论的1D3、C4.5算法以及基于最小GINI指标的CART、SLIQ方法,文中重点介绍了ID3算法和C4.5算法,并通过一些实例阐述了决策树的构建过程。人工神经网络(ANN)是一种非线性动力学系统,是生物神经网络在结构、功能及某些基本特性方面的理论抽象和简化,具有分布式信息存储方式和并行的信息处理方式,其中BP神经网络是各种神经网络模型中具有代表意义的神经网络模型之一,并已获得广泛的应用。
文章最后将决策树技术和BP神经网络技术应用于击剑训练负荷分析系统中,在运动员各项生理生化指标与运动负荷量之间建立分类模型,并通过测试样本对它们的准确性进行了比较与评价。结果表明,决策树和神经网络有着它们各自的优势和缺点,应该将它们结合起来使用。
数据库;数据分析;人工神经网络;非线性动力学系统;分布式信息存储;信息处理
中国海洋大学
硕士
计算机应用技术
魏振钢
2006
中文
TP391
62
2007-08-07(万方平台首次上网日期,不代表论文的发表时间)