华北理工大学数学建模创新实验室 河北唐山 063000
摘要:本文基于特定行业的财务信息进行研究,基于已知的影响上市公司实施高送转方案的主要因子,对上市公司是否实施高送转方案进行预测。
首先,采用CART分类树对是否实施高送转方案进行预测。其次,由于基于单一模型所得的分类结果并不客观,为寻找最佳的分类模型,建立SVM模型。在基于G-mean值对两个模型进行检验后,发现CART分类树的预测精度更高。最后,基于CART分类树得出预测结果:第八年TMT行业实施高送转方案的上市公司共有43家,行业内高送转率达到17.65%;第八年采矿行业实施高送转方案的上市公司有2家,行业内高送转率达到2.67%。
关键词:高送转;CART分类树;SVM模型
一、引言
近年来,上市公司股票股利备受关注,“高送转”公司数目和送转比例都大幅增加。考虑到不同行业特征不同,影响上市公司发生高送转行为的因子也不尽相同,故本文以行业性质截然不同的两个行业,TMT行业与采矿行业为例进行对比分析。基于已筛选出的影响两个行业上市公司实施高送转方案的主要因子,通过建立SVM模型与CART分类树进行对比分析,进而预测第8年上市公司实施高送转的情况。
二、模型的求解与建立
2.1模型准备
阅读参考文献:可知[1],上市公司一般会在公布年度业绩报告后实施高送转方案,即高送转方案是基于前一年企业的财务报告实施的。因此,本节基于筛选的前六年TMT行业和采矿行业的因子数据来训练预测模型,再将第七年的影响上市公司实施高送转方案的因子数据导入模型,即可得出第八年TMT行业和采矿行业上市公司实施高送转方案的情况。
2.1.1基于CART分类预测上市公司是否实施高送转方案
由于传统的预测模型受因子个数的限制,而CART分类适用于高维度多变量问题,故采用CART分类预测上市公司是否实施高送转方案。具体建立过程如下:
1:建立CART分类树
本节以TMT行业为例,以TMT行业前六年的31个因子数据作为结点的训练集D,计算因子对数据集的信息熵。此时,对每一个因子A,对其可能取得每个值为a,根据样本点对A=a的测试为“实施高送转方案”
将影响TMT行业中245家上市公司实施高送转方案的第七年的因子数据导入所建立的SVM模型中,即可得出第八年TMT行业实施高送转方案的情况。经计算,第八年TMT行业实施高送转方案的上市公司共有3家,TMT行业高送转率达到1.2%。
2.2模型对比与结果分析
同理,将采矿行业影响上市公司实施高送转方案的影响因子数据导入上述两个模型中,可得出具体的预测结果与模型G-mean值。为选取准确度最高的结果,将基于CART分类数和SVM模型所求的TMT行业与采矿行业的G-mean值进行对比,得结果如下:
表3:G-mean值对比
分析表3可知,CART分类树的预测精度要普遍高于SVM模型。这是由于SVM模型对大规模训练样本难以实施[2],而CART分类更适用于大规模训练样本的情况。基于CART分类树预测的结果为:TMT行业共245家上市公司,实施高送转方案的上市公司共有43家,行业高送转率达到17.65%;采矿行业共75家上市公司,实施高送转方案的上市公司有2家,行业高送转率达到2.67%。
三、结语
本文应用SVM模型和CART分类树对上市公司是否实行高送转进行预测,得出结论为TMT行业第八年实施高送转方案的情况要明显多于采矿行业,这因为TMT行业凝聚着许多中小企业,存在着股本扩张的要求,因此需要借助高送转来扩大股本,增加市值。而采矿行业内更多的是大型国有企业,本身股本较大,大多不需要通过高送转的方式来增加市值。
参考文献:
[1]李心丹,俞红海,陆蓉,徐龙炳.中国股票市场“高送转”现象研究[J].管理世界,2014(11):133-145.
[2]张伟楠,鲁统宇,孙建明.支持向量机在多因子选股的预测[J].电子技术用,2019,45(09):22-27.