同济大学土木工程学院 上海 200092
摘要:由于桩土系统极为复杂,桩土相互作用也难以准确描述,当前的理论和经验方法大多难以准确计算单桩的极限承载力。介绍了两种基于机器学习理论(支持向量机和决策树)的单桩轴向极限承载力预测方法。所用的数据从现有文献中搜集得到,共包含50组案例。将桩的几何尺寸和静力触探试验(CPT)数据作为输入变量来预测单桩承载力。将计算结果与实测结果进行对比表明,两种方法均可准确预测单桩极限承载力,且支持向量机模型比决策树模型的泛化能力更强、精度更高。
关键词:单桩;极限承载力;静力触探试验;支持向量机;决策树
引言
单桩极限承载力是桩基工程设计中的基本参数之一,其准确性对工程建设的安全性与经济性有着重要影响,因此,准确计算单桩极限承载力具有重要意义。当前,已有很多方法(包括理论和经验)来计算单桩极限承载力。但是,由于桩土系统极为复杂,桩土相互作用也难以准确描述,当前的理论和经验方法大多难以准确计算单桩的极限承载力。
以机器学习为代表的人工智能技术正在被越来越多地应用于岩土工程问题,并且取得了较好的效果[1-4]。本文建立了两个用以预测单桩轴向极限承载力的机器学习模型:支持向量机模型和决策树模型。将桩的几何尺寸和CPT数据作为输入变量,预测的单桩极限承载力作为唯一输出变量。文中所用的数据从文献中搜集汇总,共包含50组案例[5]。将预测结果与实测结果进行对比表明,两种方法均可准确预测单桩极限承载力,且支持向量机模型比决策树模型的泛化能力更强、精度更高。
1支持向量机(SVM)简介
对一个给定的数据集(x1,y1),…,(xl,yl),x∈Rm,y∈R的回归问题,SVM使用一个线性函数f(x)来给出这一问题的解,如下式:
f(x)=w·x+b (1)
式中,w是权重向量;b是位移项。W·x是两个向量的内积。
SVM在f(x)与真实值y之间的差别绝对值大于ε时才计算损失。为此,需定义一个ε-不敏感损失(ε-insensitiveloss)函数Lε(y):
.png)
(2)
目的是找到一个与所有训练数据达到最大ε偏差的函数,并保证函数尽量拟合光滑。为获得这一结果,下面的函数必须取得最小值:
.png)
(3)
满足条件:
.png)
(4)
式中,||w||2是权向量w的欧氏范数;C是一个大于0的常数;ζi和ζi*是松弛变量。
式(3)可以被重写为拉格朗日函数的形式:
.png)
(5)
式中,α和α*是拉格朗日乘子;L(α*,α)是拉格朗日函数。然后,SVM中的回归函数
.png)
可按下式计算:
.png)
(6)
式中,w0和b0分别是权向量和位移项的最优解;xr和xs是支持向量。
上述方法只适用于线性问题,但通过将数据映射到一个高维特征空间,该方法就可以拓展到非线性回归问题。高维特征空间的计算复杂度大,可以通过使用核函数来避免这一问题[6]。通过使用核函数,数据可以被隐式映射到特征空间,因此特征空间的维度不会对计算过程产生影响。因此,式(6)可以写作:
.png)
(7)
式中,
.png)
是用于非线性回归的核函数。
2决策树简介
决策树是一类常见的机器学习方法。一般的,一棵决策树包含一个根结点、若干个内部结点和若干个叶节点;叶节点对应于决策结果,其他每个结点则对应一个属性测试;每个结点包含的样本集合根据属性测试的结果划分到子节点中;根结点包含样本全集。决策树具体算法可参见周志华[7]。
决策树学习的关键是如何选择最优划分属性。对回归问题来说,常用“基尼指数”(Giniindex)来选择划分属性。数据集D的纯度可用基尼值来度量:
.png)
(8)
式中,
.png)
为当前样本集合D中第k类样本所占的比例(k=1,2,…,
.png)
);
3模型建立
3.1输入和输出变量
桩的几何尺寸和土的性质是影响单桩轴向极限承载力的两个重要方面。桩的几何尺寸主要包括桩长L和桩径D;土的性质通常包括锥尖阻力qc和侧壁摩阻力fs。本文方法使用桩端平均锥尖阻力
.png)
和沿桩身的平均锥尖阻力
.png)
作为输入数据。套筒阻力
.png)
由于对测量的准确性问题[8],计算时通常不考虑。
3.2数据预处理
为避免数据尺度对最终结果的影响,在样本训练之前先对数据进行归一化处理:
.png)
(9)
式中,xn∈[0,1],xmax、xmin分别为数据中的最大值和最小值。
3.3样本的选择
将数据随机分为两组:训练集和测试集。其中,训练集包含70%的数据(35组),测试集包含30%的数据(15组)。为避免由于分类不均匀导致结果出现偏差,在进行数据分类时进行了统计计算,使训练集和测试集的数据分布尽量相似。
3.4两种方法结果讨论
为确定支持向量机和决策树两种模型的预测精确度,采用确定系数R2作为评定的指标,定义如下:
.png)
(10)
.png)
(11)
.png)
(12)
式中,u是残差平方和,v是总平方和,N是样本数量,i是每一个数据样本。
经计算,在训练集中,决策树和支持向量机的确定系数分别为0.9971和0.9037;在测试集中,决策树和支持向量机的确定系数分别为0.9017和0.9274。如图1和2所示。可以看出,在训练集中,决策树模型准确率优于支持向量机模型;而在测试集中,决策树模型的准确率反而下降了。这是因为决策树算法产生了过拟合,即在训练集表现很好,而在测试集中表现一般。对于支持向量机模型,它的准确率只受支持向量的影响,因此很少会出现过拟合情况。
4结论
由于桩的轴向极限承载力受众多因素影响,影响因素与承载力之间表现出高度的复杂性和非线性,传统的理论或经验方法往往不能准确地计算单桩承载力。本文的结果证明,所提出的支持向量机模型和决策树模型均能准确地预测单桩的轴向承载力。
但是,决策树模型往往会产生过拟合,尤其是在样本数量较少和数据集特征较多的情况下。而支持向量机模型的准确率只跟支持向量数量有关,因此在训练集和测试集上的表现均较好。所以在样本数量较少时,建议优先使用支持向量机模型。
此外,除本文考虑的因素外,成桩方式、桩身材料、加载方式、桩端是否闭合等都会对结果产生影响。在后续的研究中可以进行详细探讨。
.png)
图1训练集单桩承载力实测与预测结果
.png)
图2测试集单桩承载力实测与预测结果
参考文献
[1]周苏华,周帅康,张运强,等.基于支持向量机的膨胀土胀缩等级预测[J].中国地质灾害与防治学报,2021,32(01):117-26.
[2]夏建中,罗战友,龚晓南,等.基于支持向量机的砂土液化预测模型[J].岩石力学与工程学报,2005,22):4139-44.
[3]师旭超,郭志涛,韩阳.基于支持向量机的砂土液化预测分析[J].西北地震学报,2009,31(04):363-6.
[4]史昌盛,刘秋霞,韩世界,等.打入桩轴向极限承载力预测的机器学习方法 [J]. 铁道建筑技术, 2019, 08): 153-9.
[5]ESLAMI A. Bearing capacity of piles from cone penetration data [D]; PhD thesis, University of Ottawa, 1996.
[6]SMOLA A J, SCH
.png)
LKOPF B. A tutorial on support vector regression [J]. Statistics and computing, 2004, 14(3): 199-222.
[7]周志华.机器学习[M].北京:清华大学出版社,2016.
[8]ALKROOSH I, NIKRAZ H. Correlation of pile axial capacity and CPT data using gene expression programming [J]. Geotechnical Geological Engineering, 2011, 29(5): 725-48.