极大相关问题的数值方法
典型相关分析(Canonical Correlation Analysis,CCA)是研究两组变量之间相关关系的一种多元统计方法.它能够揭示出两组变量之间的内在线性关系.CCA的目的是识别并量化两组变量之间的相关关系,将两组变量相关关系的分析,转化为一组变量的线性组合与另一组变量线性组合之间的相关关系分析,利用这两个综合变量之间的相关关系来反映两组指标之间的整体相关性.典型相关分析已被广泛应用于生物学、心理学、市场营销、工业生产以及信息技术等领域,因此典型相关分析有很重要的研究价值.
典型相关分析是由Hotelling首先提出,其基本思想是在每组变量中找出变量的一个线性组合,使得组合得到的变量之间具有最大的相关系数.然后选取相关系数仅次于第一对线性组合并且与第一对线性组合不相关的第二对线性组合,如此继续下去,直到两组变量之间的相关性被提取完毕为止.被选出的线性组合配对称为典型变量,它们的相关系数称为典型相关系数.
为研究多组变量典型相关问题,Van de Geer提出了.Maxbet方法,并把它用于检测多组变量之间的最大相关性.而Maxbet算法就是在满足约束条件:uiTui=1,i=1,2,,…,m下求函数f(u)=uTXTXu的最大值,称为极大相关问题(MCP).使用Lagrange乘子理论,则导出了多元特征值问题(MEP).
在实际应用中我们用到的是MCP的全局极大解,即极大相关解,而已有的理论研究和数值实验表明,求解MEP,我们往往得到的是MCP的局部极大解,这限制了其实际应用.为了更好的求解MCP的全局极大解,本文主要提出了两种算法和一种初始向量选择策略.
在算法方面,为了能更好的得到MCP的全局极大解,本文对P—SOR算法的收敛性理论进行了完善.由于数值实验证明P-SOR算法对松弛因子ω的选择具有很强的敏感性,本文提出了对松弛因子ω的选择相对不太敏感的P-SSOR算法(第二节,算法2-2),并进行了充分的数值实验,验证了P-SSOR算法的优越性.
虽然我们还不能找出一定能得到全局极大解的算法,但运用关于MCP全局解的性质以及已有的结论,本文在第二节还提出了一种能更有效的求解MCP全局极大解的方法(算法2-3).通过对大量例子、选用任意方式求解出的MEP的解((∧),(x))运用算法2.3,总能得到全局极大解(∧*,x*).这充分地说明了算法2.3是很有效的求解MCP全局极大解的方法.
已有的结论表明:对于MCP,是否能收敛到MCP的全局极大解,以及收敛速度都和初始向量的选择有很大关系,如果初始向量选择不恰当,对一般的MCP问题来说,很可能收敛到局部极大解,收敛速度也会很慢.在本文的第三节,我们根据Maxvar的解法,进行了改进,提出了新的初始向量选择策略(第三节,策略3),对初始向量进行了大量的数值实验,结果表明:通过策略3选择的初始向量,一般都能很稳健地收敛到全局极大解,而且,迭代步数明显减少.
典型相关分析;极大相关问题;多元特征值;P-SOR算法;松弛因子;初始向量选择策略
中国海洋大学
硕士
计算数学
刘新国
2010
中文
O189.13
47
2011-10-31(万方平台首次上网日期,不代表论文的发表时间)