机器学习在多Agent系统控制决策中的应用研究
本论文对机器学习算法在多Agent系统控制决策中的应用进行了研究:针对多Agent系统中普遍使用的有施教者的学习算法,提出基于范例的学习方法,该方法独立于特定的学习算法之上,主要解决训练数据的获取问题;针对有施教者的学习算法中训练数据的噪声的问题,提出了基于聚类的训练数据预处理算法,通过对训练数据完成两次聚类处理,有效地消除噪声数据,从而提高学习算法的学习效率;为了更有效的提高多Agent系统的稳定性,本文还提出了多Agent系统中的潜在角色值方法,通过改进多Agent系统的角色模型,从根本上避免了由于可能出现的Agent之间的频繁角色转化而造成的系统效率损失及系统不稳定性。实现了Agent自学习。
机器学习算法根据是否有施教者可以分为三大类:有施教者的学习,无施教者的学习和增强学习。其中,有施教者的学习算法在多Agent系统中应用最为普遍,比如人工神经网络算法和决策树算法等。由于学习算法本身的工作机理,他们都需要依靠训练数据来实现学习器的泛化。本文提出的基于范例的学习方法主要解决的就是训练数据的获取问题,该方法独立于特定的学习算法之上,利用多Agent系统的可观测性,在线积累原始数据,然后进行集中离线泛化,从而实现了在线、离线相混合的学习。
除了训练数据的获取,几乎所有有施教者的学习算法都面临的另一个问题就是训练数据的噪声问题。数据中噪声的产生有多种原因。虽然许多学习算法都有鲁棒性和较强的容错性,噪声的存在可能不会影响最终的学习效果,但会影响算法的收敛速度。而对于那些容错性较差的算法,噪声数据的存在则会直接影响学习效果。本文提出的基于聚类的训练数据预处理算法能够在多项式时间内对训练数据完成两次聚类处理,通过可控参数的调整,有效地消除噪声数据,从很大程度上提高学习算法的收敛速度和学习效率。
在多Agent系统中,可以定义Agent成员的角色模型。足球机器人系统就是最典型的具有角色模型的多Agent系统。本文提出的潜在角色值方法,通过定义Agent的潜在角色值,改进了此类多Agent系统的角色模型,从根本上避免了由于可能出现的Agent之间的频繁角色转化而造成的系统效率损失及系统不稳定性,实现了Agent自学习。该方法从定义上属于增强学习算法的范畴。
机器学习;多Agent系统;足球机器人系统;潜在角色值
中国海洋大学
硕士
计算机应用技术
孟庆春;魏振钢
2005
中文
TP181
47
2006-07-27(万方平台首次上网日期,不代表论文的发表时间)