龙江环保集团股份有限公司 黑龙江哈尔滨 150090
摘要:因子分析是一种多元统计数学方法,用其可以解析数据集合,分析多个变量间的关系.其目的在于对大量观测数据,用较少的有代表性的因子来说明众多变量所提取的主要信息,它在心理学和社会科学上首先得到应用,60年代开始用其解决物理和化学以及环境问题,效果亦十分显著.因子分析按变量与样品间的关系可分为R型因子分析和Q型因子分析;按对数据变换方法的不同又可分为抽象因子分析(AFA)和目标因子分析(TFA).目前在环境中,因子分析主要应用于环境成因的推导与环境监测两大方面.
关键词:因子分析;环境;监测;应用
引言
为准确掌握生态环境质量及其变化趋势,我国已在各地设有不同级别的环境监测站,逐渐积累了连续的环境监测数据集。基于已有数据,国内学者已广泛开展关于污染物排放、气象、水文条件等因素的内在关联,以及这些因素对生态环境质量影响过程的研究,并建立众多基于数理过程的模型,以还原生态环境变化过程。但由于污染过程和影响因素的不确定性、随机性和复杂性,这些模型通常只能运用于特定条件。基于此,国内外学者提出大量基于未知过程的多元统计、不确定性分析、灰色系统理论、黑箱模型等研究方法,取得较好效果。
1 动态因子分析理论概述
关于动态因子分析理论的研究可以结合卡尔曼滤波和最大期望参数估计法进行。针对普通时间变量的变化模式,多元的响应变量之间存在着复杂的相互作用。并且,这些物理量还会受外界因素变化而出现明显的波动。通过对这些物理量波动规律的进行动态因子分析,就可以得出其变化的规律,进而填补一定范围内的缺失值并预测出未来的数据变化趋势。研究者只需利用原始数据并配合相应的模拟软件对原始数据进行分析,即可获得较短时间内或非平稳时间内的数据序列。这对于弥补环境监测领域中缺失的物理量数据或预测非平稳时间内生态环境参数变化趋势都有着重要的应用和研究价值。动态因子的算法利用降维的统计原理,能够将多个线性组合与环境数据的变化趋势相融合,从而推算出潜在的未知变量,并能有效地消除由观测误差所造成的环境变化趋势误判断。在数据预处理的过程中,根据动态变量变化的规律可准确排除环境监测参数的异常。在进行数据的统计分析前能够提前消除季节的影响,进而将显性的环境变化趋势和真实有效的物理量信息关联重组,得到更为精准的环境观测数据。应用标准分数法和多层级变量的统计还能够将观测值最大化的接近于真实值。配合方差膨胀因子和多重共线性计算的综合利用,可进一步排除无关变量对于环境变化趋势产生的预测干扰。在应用动态因子分析时,数学模型的选择要格外慎重。首先,表达式中的物理量的个数和类型要尽可能贴近实际环境物理量的个数和类型。其次,为了避免过度拟合或拟合效果失真等情况,可建立辅助的拟合评估体系,用于诊断监测数据拟合过程是否存在异常或严重的偏差等。当评估结果与拟合值越接近时,则表明模型得出的环境变化预测结果越接近于真实的环境演化过程。
2 因子分析在环境科学与环境工程中的应用
2.1 进行因子旋转
与不考虑因子旋转时得到主成分模型的初始因子载荷矩阵相比较,旋转前的公共因子对变量的解释意义不是很明确。初始因子载荷矩阵中,四个公因子对变量总氮、硝酸盐氮的说明比较模糊,有必要对其作因子旋转。第一主因子主要由变量高锰酸盐指数、BOD、COD、DO共同表征,也即是有机综合指标,其反映有机污染指标的重要性;水体中有机阴阳离子等物质的量主要由变量氨氮、总磷、硝酸盐氮共同表征。其中硝酸盐氮是填充对地下水影响的重要因子主要是由于硝酸盐氮的载荷比较高;第三主因子由变量总氮表征,由于检测中总氮的超标比较严重,因此更加印证了对总氮的监控的重要性;第四主因子则由变量pH值表征,说明了水质的酸碱程度的影响方面。
由此我们也可以知道,四个公因子充分反映了矸石淋出水样中,有机综合指标、硝酸盐氮、总氮、pH值是重要的检测因子。
2.2 在地表水域生态环境中的应用
将DFA应用于生态领域,将瓦登海(WaddenSea)西部潮间带12种生物数量时间序列作为响应变量(每年3月采样),温度序列作为解释变量,探讨1970年以来不同种类生物数量随时间变化的共同模式及受温度的影响。通过AIC值判定最佳模型:3个共同趋势+解释变量+对称非对角误差矩阵。通过共同趋势对不同生物数量的因子载荷,划分3类变化模式,并指出温度显著影响生物数量。亦将渔业数据应用于DFA模型,探讨欧洲西北13个地区海螯虾数量变化,明显归纳出3个共同趋势变化。虽然根据AIC值,最佳DFA模型为3个共同趋势,无解释变量,但并不代表环境变量对海螯虾数量没有影响。由于AIC准则考虑模型参数,每增加一个解释变量,便增加与响应变量个数相当的新参数,若新增解释变量只影响部分响应变量,所导致模型的改进无法抵消参数增加的影响,则会使AIC值升高。基于此,应用典型相关系数判定解释变量与共同趋势的关系,并考虑时间延迟得出海水表层温度与延迟2年的第一共同趋势相关,表明代表未知因素的第一共同趋势亦影响海螯虾数量和海水表层温度。
2.3 动态因子分析在地表水环境监测中的应用
动态因子分析法在地表水生态环境研究中已经有十余年的应用历史。在实际的应用中,如何选择响应变量和解释变量对实际应用效果有着决定性的影响。为了能够真实的反应出监测区域地表水环境的质量和变化趋势,研究者必须根据相应区域的污染程度和地域特点选择匹配度最高的响应变量和解释变量。通过与环境中微生物、水温、盐度和气象等条件的关联,从而确定近海岸、中海岸、远海岸等不同区域水质的所需的监测指标。通过对监测所得到的大量数据进行经过严谨周密的计算和模型拟合后,研究者能够了解监测时间段内该区域内地表水环境的真实的整体变化情况。
3 结语
以上可以看出因子分析是一个强有力的数据分析工具,可以用它来解决很多环境问题,例如:污染来源的判别、环境样品的分类、监测点的优化及污染物的组份测定等.此外,随着因子分析应用范围的不断扩大,产生了许多新的方法,例如:秩消因子分析法、渐进因子分析法、迭代因子分析法等.而这些方法又扩大了因子分析的使用范围,从而形成了一个良性循环.因子分析在环境中的应用十分广泛,概括起来主要有以下几个方面:第1,可以压缩原始数据.第2,是成因推理的有效手段.第3,可以分解益加的环境过程,筛选出主要因素.第4,可以分析样品间的相关程度,并据此对样品进行分类.要正确的使用因子分析还需注意以下几点:l)要对所要解决的问题有充分的理解.通过对问题的充分理解,找出其中与因子分析的基本假设相符或相近的地方.如果该问题不满足因子分析的基本假设,就不能使用因子分析.2)计算机及其软件的发展使得因子分析得到了广泛的应用.由于因子分析是一种大型多元统计分析方法,它的计算非常复杂,计算量也非常大.在计算机产生以前,很少有人能把因子分析用于解决实际问题.计算机事业的飞速发展,使因子分析在各领域中的应用进人实用的阶段.目前世界上几种包含因子分析的著名软件系统主要有:SAS、SPSS、Satitsitca等软件,使得人们只需少量编程便可在较短的时间内得到计算结果,因而因子分析逐渐得到了广泛使用.3)对因子分析结果做出合理的专业解释.因子分析的数学过程是基本相同的,只有把它用在具体问题当中才有实际意义.因此,对于在不同方面应用因子分析产生的因子做出合理的专业解释,并且要知道在何种情况下因子无法解释,以及变换到何时可以对因子进行解释也是因子分析的关键所在.
参考文献:
[1]李昌敏,熊俊俏.基于动态指数平滑环境预测系统[J].科技与创新,2019,(21):56-58.
[2]刘云莉.面向智慧林业环境因子监测系统的研究与设计[J].物联网技术,2016,6(4):66-68.