逐步回归统计模型建立过程中算法优化问题的研究

发表时间:2020/9/17   来源:《科学与技术》2020年12期   作者:魏长婧
[导读] 介绍了逐步回归统计模型建立的步骤,指出了计算过程中存在的问题,针对存在的问题进行了分析,并提出了优化该问题的方法,
        魏长婧
        ( 河南省岩石矿物测试中心,河南 郑州450012)
        摘  要  介绍了逐步回归统计模型建立的步骤,指出了计算过程中存在的问题,针对存在的问题进行了分析,并提出了优化该问题的方法,最后通过VB 6.0采用优化算法编程完成了大坝变形监测逐步回归统计模型建立,并将该程序应用于丹江口大坝1975-1981年间变形监测资料的数据处理,建立了逐步回归统计模型,验证了优化算法的正确性。
关健词  逐步回归统计模型 算法稳定性 算法优化
中图分类号  P258
The Study of the Algorithm to Optimize during the Establishment of
Stepwise Regression Statistical Model
Wei Changjing1,2,3  Lei bin3,4  Wang Yunjia1,2,3
 (Henan Rock and Mineral Testing Center,Zhengzhou,450012,China)
Abstract  This paper introduces the steps of stepwise regression statistics model establishment, pointes out the problems in the process of calculation, analyzes them and puts forward the method of optimization these problems.At last, it completed the establishment of the dam deformation monitoring stepwise regression statistics of the model , using optimization algorithm, by VB 6.0 programming, and the program procedures was used in the data processing of deformation monitoring material of danjiangkou dam during 1975-1981, and established the stepwise regression statistical model to verify the correctness of the optimization algorithm.
Keywords  Stepwise regression statistics of the model,Algorithm stability,algorithm optimization
逐步回归统计模型是大坝变形监测数据处理的一种有效方法。它根据工作人员的经验选取影响因子,并利用数理统计中的F检验通过循环剔除回归方程中影响作用不够显著的影响因子,从而建立逐步回归统计模型,达到变形监测的目的[1-3]。
在逐步回归统计模型的建立过程中,由于数据量大,使得在计算初选模型时矩阵求逆变得极容易出错,其根本原因是随着数据量的增大,算法本身存在不稳定性,因而增加了计算的难度。本文在对逐步回归统计模型的建立方法做了简要说明后,针对算法的不稳定性进行了分析,并指出了优化算法的方法。最后,利用VB 6.0通过编程实现了大坝变形监测逐步回归统计模型的建立,并采用丹江口大坝1975-1981年间的变形监测数据进行了实验,完成了丹江口大坝变形监测逐步回归统计模型的建立,验证了算法的正确性。
1 逐步回归统计模型的简介
逐步回归计算是建筑物进行变形监测数据处理的一种有效方法,它首先需要建立一个回归方程的初选模型:


该方程中包含工作人员根据经验或通过对变形值与外界作用因子间的初步分析选出的对建筑物的变形起影响作用的因子。
第二步,按最小二乘原理,计算出系数矩阵的最小二乘估计值[4]:

第三步,在此回归方程中找出系数为最小者,并将其剔除出回归方程,之后,重新进行回归计算,建立新的回归方程。
第四步,进行回归系数显著性检验。计算第一次回归方程的残差平方和以及新的回归方程之残差平方和。求出,组成式(3)的统计检验量F,并进行F检验。若检验表明该因子作用不显著,则正式剔除出回归方程,否则就保留在方程内。

式(3)在零假设下是自由度为的F变量。根据此自由度和选择的置信水平,可在F分布表中查得对应的之值。如果由式(3)计算出的,那么表明在所选择的置信水平下,假设不可信,表明因子回归效果显著,应予接纳入回归方程中。
第五步,对第二个系数较小的因子进行显著性检验,一直到全部因子检验结束为止。逐步回归中,每剔除一个因子后均要重新建立回归方程。
第六步,进行回归方程显著性检验。进行全部因子显著性检验后,对所建立的回归方程作回归效果显著性的检验。检验采用数理统计中的F检验。

式(4)在零假设下是自由度为的F变量。根据此自由度和选择的置信水平,可在F分布表中差得对应的之值。如果由式1-4计算出的,那么表明在所选择的置信水平下,假设不可信,即回归方程的效果是显著的。
如果效果不太理想,则可把备选因子或另一些未被考虑的因子逐个加入此方程中,并对新加入的因子逐个地进行显著性检验。检验方法同于第4步。若该备选因子回归效果显著,则进行回归方程显著性检验。直到回归方程中各因子作用都显著,而且方程回归效果也很显著,就可以得到所需的最佳回归方程了[2-3,5-6]。
2 模型建立过程中的算法优化问题研究
在逐步回归统计模型的建立过程中,第二步计算系数矩阵的最小二乘估计值时,需要求出的逆矩阵,而这个逆矩阵很容易计算错误。其原因是求逆矩阵的算法存在不稳定性。造成算法不稳定的原因有三方面:1、有限位舍入计算时,若将两个数量级相差很大的数相加,就可能造成“大数吃小数”的现象,计算机不满足加法结合律。2、使用了绝对值很小的数作分母,这样就会得到一个绝对值很大的数,一方面它会使舍入误差成倍数扩大并产生溢出,另一方面,如果再用这个很大的数与其它数作加法,又可能造成“大数吃小数”的现象,进一步产生较大的误差。3、两个相近的数进行了相减,这样会造成有效数字的损失[7]。
因此,在编程求解逆矩阵的过程中,即使考虑得再周全,如果采用的算法本身存在不稳定性,也就无法避免计算结果的错误。同时,由于逐步回归统计模型建立过程中用到的矩阵比较大,我们并不能采用高斯(顺序)消去法求线性方程组的方法来求逆矩阵,而应该采用一种更为稳定的算法,叫做列主元高斯消去法。它的基本思想是:在进行消元之前,先按列选择绝对值较大的元素作为主元,然后再进行消元。经过n-1次消元后得到一个上三角方程组,再进行回代即得解。
3 优化后算法的应用
本文采用优化后的算法,通过VB6.0进行了逐步回归统计模型建立,其主要流程图[8-10]如图1所示。
  
图1  逐步回归模型的建立程序设计流程图

实验采用丹江口大坝1975-1981年间的变形监测数据,并根据相关资料选择了库水位以及、观测前十天的平均库水位、观测当天的水温、观测前十天的平均水温以及观测前
三十天、六十天、九十天的平均水温等13个影响因子作为初选因子[11],选取观测次数为14次。为了验证优化算法的正确性,将矩阵求逆的结果提取出来,并与采用Excel求解的结果进行对比,两者结果相同。
   最后,得到丹江口大坝变形监测的逐步回归统计模型,如图2所示。

图2 逐步回归统计模型的建立结果

5 结论
本文针对逐步回归模型建立过程中的算法不稳定性问题进行了分析,并指出了应该采用列主元高斯消去法来提高算法的稳定性。最后,将该算法应用于丹江口大坝逐步回归统计模型的建立,验证了优化算法的正确性。不过,这种方法主要适用于求解中小型稠密的线性方程组,对于大型稀疏的线性方程组来说,更有效的方法是迭代法。
参考文献
[1]  张正禄等. 工程测量学[M]. 武昌:武汉大学出版社,2013:204-205.
[2]  黄声享,尹晖,蒋征. 变形监测数据处理[M].武汉:武汉大学出版社,2010:99-101.
[3]  岳建平,田林亚. 变形监测技术与应用[M]. 北京:国防工业出版社,2010:120-125.
[4]  武汉大学测绘学院测量平差学科组. 误差理论与测量平差基础[M].武汉:武汉大学出版社,2012:103-105.
[5]  朱友聪,张建平,李红健. 拱坝变形监测中的逐步回归分析应用研究[J]. 浙江水利水电专科学校学报,2009,21(2):20-24.
[6]  杨永超,李东辉. 回归分析模型在大坝变形监测中应用[J]. 地理空间信息,2011 (6):1672-4623.
[7]  胡建华,陈兴同,曹德欣. 数值计算方法[M]. 徐州:中国矿业大学出版社,2008:12-15.
[8]  罗朝盛,宇文芳,余平. Visual Basic6.0程序设计教程(第二版)[M]. 北京:人民邮电出版社,2008:全书.
[9]  邢庭松. Visual Basic 6.0在工程测量中的应用开发[J]. 隧道建设, 2007,27(5):82-84.
[10]  佟彪. VB语言与测量程序设计[M]. 第一版. 北京:中国电力出版社,2013:217-232.
[11]  吴子安. 大坝变形监测数据回归分析中的因子选择[J]. 武汉测绘科技大学学报, 1993,18(1):20-26.

作者简介:魏长婧,女,汉,1986.6,河南省辉县市,硕士研究生,助理工程师,河南省岩石矿物测试中心,郑州市金水区金水路28号,研究方向:工程测量,遥感图像分析与处理。
投稿 打印文章 转寄朋友 留言编辑 收藏文章
  期刊推荐
1/1
转寄给朋友
朋友的昵称:
朋友的邮件地址:
您的昵称:
您的邮件地址:
邮件主题:
推荐理由:

写信给编辑
标题:
内容:
您的昵称:
您的邮件地址: