数据挖掘分类技术在健身会所管理系统中的应用研究
随着信息化飞速发展,各行各业每天都有大量的数据产生。在以前我们对待这些数据,只是简单的查询、删除、统计等操作,并没有对这些数据进行更深入的分析,从中寻找利于企业、社会发展的信息。这完全是对信息资源的一种浪费。随着计算机技术,特别是数据挖掘技术的发展,这个问题的解决得到了行之有效的方法。数据挖掘技术是一门新兴的交叉学科,经过几十年努的力,数据挖掘技术在许多领域得到广泛的应用,并取得了良好的效果。
分类技术是数据挖掘中使用比较多的一种方法,通过分类从数据集中提取描述数据类别的一个模型(一般通过决策树或者规则表示出来),并把数据集中的每个对象影射到给定类别的某一个中,进而可以预测未来数据的归类。本文通过对各种分类算法的学习研究,从中总结它们的优缺点,为我们选择C4.5算法提供了依据。C4.5分类算法改进了ID3算法不能处理连续数据和多值偏向的问题。
本文以健身会所的需求为背景,建立一套科学的信息管理系统并导入历史数据,重点讨论决策树分类技术的应用,并把C4.5决策树分类算法应用到系统中会员续期预测功能中。通过管理者的经验分析,选择几个对会员续期有影响的因素,从数据库中选择近期续费的会员信息,并对这些数据做了消除噪声、离散化等相应的处理,使其成为适合数据挖掘的数据。利用C4.5分类算法对处理过的会员续期记录进行分类,从中提取分类规则,用于预测将来会员续期的情况,协助管理者制定相应的保持客源的策略,为会所的健康发展提供有力的支持。
数据挖掘;分类技术;C4.5分类算法;健身会所;会员续期预测
中国海洋大学
硕士
计算机应用技术
魏振钢
2011
中文
TP311.13
60
2011-10-31(万方平台首次上网日期,不代表论文的发表时间)