刘杨,张旭辉,白晨曦,蔡一鸣
武汉工程大学,430205
摘要:随着中国经济的不断发展,中小微企业已经成为了国家经济高质量增长的重要基础。本文对中小微企业的信贷问题,给出了分析方案。
针对问题一,首先对题目和数据进行研究分析,提取出可以决策信贷风险的7个指标:利润率、纳税总额、信誉评级、是否违约、供求关系稳定性、作废发票占比、线性拟合曲线斜率。使用SPSS软件,对指标赋予不同的权重,将指标和量化分析联系起来。最后从剩下99个企业中分别选取样本作为训练集、测试集,建立神经网络模型,对比发现预测值与实际值较为吻合,模型建立成功。对企业的信贷风险进行量化分析,得到相应的结果。量化指标为负数,对企业不放贷,反之放贷;贷款额度和利率则将量化指标看做比例,建立相应的模型进行计算;贷款期限我们均规定为1年。
针对问题二,我们先将第一问中的123个企业的数据构建出合理的BP模型。将302家企业的数据代入,即可得到相应的信誉评级和风险量化指标。信贷策略与问题一解法相同。
针对问题三,找出了中小型企业在2020年新冠疫情的影响下的经济数据报表,选择贝叶斯林回归算法,利用回归结果预测了在2020年2月至12月的不同行业的产销恢复率。根据拟合曲线得到相应在突发情况(即新冠疫情)下的抗风险程度,将其作为指标引入之前建立的神经网络模型,制定出相应的贷款策略。
关键词:信贷决策;神经网络算法;多元回归
模型;主成分分析;
1.1问题一的模型建立与求解
1.1.1第一小问模型的建立—神经网络模型
一、确定各个指标的权重
利用SPSS,对处理之后七个指标赋予不同的权重,然后进行权重求和,得到正向化的量化指标(越大越好)。数值越大,表明信贷风险越低,而对于其中那些负值的数,将其转化为0,即不予以放贷考虑。
二、选取训练集和测试集,判断建立的神经网络模型是否合理
从99个企业中选取训练集、测试集。通过创建网络、设置训练参数、训练网络、仿真测试,得到性能评价,得到训练集与测试集的对比分析。发现图像拟合的比较完整,模型的合理性很好。
三、第一小问模型的结果
利用已经建立的神经网络模型,对99个公司的风险程度进行量化。风险指标数值越大,表明风险程度越低,即该公司信誉程度越大。分析发现,大部分数据集中在30%左右,与实际情况较为符合,预测结果很好。
1.1.2第二小问模型的建立与分析—信贷策略模型
一、确定是否放贷
信贷风险的量化指标为负数时,不予以贷款;为正数时,予以贷款。信誉评级为D的企业不予以贷款考虑。
二、贷款额度模型
在现实生活中,银行一方面会及时判断企业资金流,确保有还款能力;另一方面当比例为30%时,银行能够基本保证企业还款数。运用类比的方法利用前文的量化指标作为比例,将100万作为基础金额,得到公式为:
贷款金额=基础金额×量化指标。
对该方法的解释为,量化指标越大,说明该公司的信誉程度越好,与基础金额的乘积就会越大,则该公司的贷款额度就会越高。
三、贷款利率模型
模型的建立与求解
①:针对三种信誉评级,制定不同的客户流失率和年利率区间。
②:针对每一个特定的评级进行分析。对于信誉度最高的企业,给予较低的贷款年利率。两者呈现负指数相关性。
③:以A等级为例,有26家企业需要确定年利率,将利率区间的差值划分成了26份,依次累加,得到26个年利率。然后根据企业信誉度从大到小的顺序,分别赋予26个从小到大排序的年利率,由此得到每个企业具体所需的年利率。
四、贷款期限
根据题意可以得出,贷款期限均为1年。
1.2问题二的模型建立与求解
数据处理方法与问题一相同。
1.2.1模型的建立与检验
首先利用附件1中的数据,构建出合理的BP模型。最后对附件2中的302家企业进行评级值的预测。通过结果图示可以看出,该神经网络模型真实值与测试值的吻合程度良好。可以用来对302家企业信贷风险进行量化分析。
1.2.2模型的结果与分析
一、信贷风险量化分析
利用上述预测好的神经网络模型,将302家企业全部看做测试集。在得到信誉评级之后,得到相应的信贷风险量化分析结果对比。
二、信贷策略
1.确定是否放贷
方法与问题一相同,即根据量化分析来进行判断,正值则给予赋值。
2.贷款额度模型
该问题在问题一的基础上,增加年度信贷总额为1亿元这一条件。进行一系列的运算得到符合条件的贷款额度。
表1-7贷款额度预测(部分数据)
.png)
3.贷款利率模型
与问题一方法相同,根据企业的信誉评级,对其进行分类。
4.贷款期限
根据题意可以得出,贷款期限均为1年。
1.3问题三的模型建立、求解和结果—以新冠病毒疫情作为突发情况
我们选择如下指标进行模型检验和选择:可解释方差(Explained Variance)、平均绝对误差(MAE)、均方差(MSE)、决定系数(R2)。调用相关变量的历史数据,利用Python语言和机器集成算法中的指标评价库(Sklearn.metrics)对相关数据进行处理。
模型效果的检测与评估
(1)模型检测
为了评估实际值与预测值的效果,我们选择如下指标进行模型检验和选择:可解释方差(Explained Variance)、平均绝对误差(MAE)、均方差(MSE)、决定系数(R2)。调用相关变量的历史数据,利用spss和机器集成算法中的指标评价对相关数据。可得到有关前述6种不同回归模型的主要评估检测指标。
.png)
表中的检测结果表明,BayesianRidge和ARDR的测算效果最好:XGBR、GBR这两个集成算法的测算效果较好,但要弱于前两者,而SVR和ElasticNe模型的预测效果都不理想。
(2)疫情对我国中小服务型企业的影响预测——基于BayesianRidge模型
贝叶斯线性回归不仅可以解决极大似然估计中存在的过拟合的问题,而且它对数据样本的利用率是100%,仅使用训练样本就可以有效而准确的确定模型的复杂度。
利用贝叶斯回归判断影响。