基于不完全对称信息下的客户授信评估研究 邵琦

发表时间:2020/9/1   来源:《论证与研究》2020年7期   作者:邵琦 刘韶辉 袁雪琴
[导读] 摘要:随着社会经济的发展,保理行业的需求越来越大。面对形形色色的客户,保理公司需要对客户提供的数据进行分析计算,继而进行客户授信额度的估算或者是判断客户违约的可能性。本文主要针对客户的保理数据,建立了粗略的违约预测模型和授信额度估算模型的研究。利用全部保理数据即全部变量进行了逻辑回归,基于二分类的逻辑回归做了违约预测模型,可以根据客户的信息计算出违约的可能性。首先对于各个变量引入模型合理性进行了讨

                                                                                           邵琦1 刘韶辉2 袁雪琴1
                                     (1.成都理工大学管理科学学院 四川 成都 610059;2.仲恺农业工程学院化学化工学院 广东 广州 510000)
        摘要:随着社会经济的发展,保理行业的需求越来越大。面对形形色色的客户,保理公司需要对客户提供的数据进行分析计算,继而进行客户授信额度的估算或者是判断客户违约的可能性。本文主要针对客户的保理数据,建立了粗略的违约预测模型和授信额度估算模型的研究。利用全部保理数据即全部变量进行了逻辑回归,基于二分类的逻辑回归做了违约预测模型,可以根据客户的信息计算出违约的可能性。首先对于各个变量引入模型合理性进行了讨论,基于两总体的逐步判别分析建立了更加合理的违约预测模型。其次将违约预测模型得出的违约概率与Time变量与Amount变量进行多元回归,寻找其三者间的关系建立授信额度估算模型。最后由于客户的保理数据有可能会有缺失,缺失值对违约预测模型与额度估算模型都有一定的影响,但根据违约预测模型的思想,若将缺失值视作剔除值再次构建违约预测模型,从而可以构建授信额度估算模型,而这却不失其合理性并且赋予其动态性。
        关键词:逻辑回归;逐步判别分析;多元线性回归
        引言
        保理业务是指卖方、供应商或出口商与保理商之间存在的一种契约关系。根据该契约,卖方、供应商或出口商将其现在或将来的基于其与买方(债务人)订立的货物销售或服务合同所产生的应收账款转让给保理商,由保理商为其提供贸易融资、销售分账户管理、应收账款的催收、信用风险控制与坏账担保等服务中的至少两项。近年来,无论国内贸易还是国际贸易,赊销结算方式日渐盛行,以国际贸易为例,信用证的使用率已经降至16%,在发达国家已降至10%以下,赊销基本上取代了信用证成为主流结算方式。在赊销贸易下,企业对应收账款的管理和融资需求正是保理业务发展的基础。随着社会经济的蓬勃发展,保理行业需求越来越大。保理公司需要根据客户提供的数据进行授信额度的计算,包括违约的可能性等等。客户进件过程中资料不齐全导致无法完整提取财务信息,按现有额度授信公式计算需还原财务报表,工作量过于繁杂且误差较大。
        1、问题分析
        对于给出的保理数据,其中Time和Amount(即时间窗口和信用额度)不作为变量算入建立的违约判别模型,而其他变量均引入。粗略地说,一个人或一个团队的信用额度可以看作为保理公司对其的授信额度,授信额度正是保理公司和企业所需要的参考量;时间窗口描述的是保理行业的客观规律而不是第一个模型中针对每个客户的能够对模型做出足够贡献的变量,这样在针对客户本身信息的分析就不应包括这一变量。而在授信额度估算模型中是结合客户的信息和时间窗口这样的客观变量来进行分析,自然就引入这两个变量。涉及的违约判别模型和授信额度估算模型,前者是一个分类判别问题,即面对一组未知数据来判断其来自于哪个总体,后者是根据数据寻找其与客户的授信额度之间的关系,继而建立授信额度估算模型来估算授信额度。我们先在此假设客户的信用额度近似看成是该客户的授信额度,在之后我们将看到不限于这一假设。
        2、模型的建立
        基于大量的数据下,对客户进行违约判别属于分类问题。逻辑回归是一个用于二分类的算法,此算法的结果输出为1或0,而这对应着class变量中的1和0。在此先利用了线性函数来进行逻辑回归,之后会发现其回归的准确度达到了相当的水平。
        事实上每次判断都是先进行剔除变量的判断再进行引入变量的判断,到最后跳出迭代的条件则是既不剔除也不引入变量;每次进行判断都围绕着变量自己的Wilks值与其他变量的Wilks值进行比较,处于最值的Wilks值变量理应进行判断引入或剔除,再与我们规定的门槛值fxk进行比较,若合适则确实引入或者剔除变量。门槛值符合F分布,即有
        fxk~F(27,+∞)
        在此选择用多元线性回归拟合函数关系式,再用显著性检验线性关系是否效果好。我们设方程有形式为
        y=β01x12x2
        其中y代表信用额度,x1代表时间窗口变量,x2代表客户不违约判别结果变量,在此次我们不打算换算x2为最终落入不违约总体的概率,因为这一结果已经和最终概率之间是线性关系因此在回归分析中是等效的。在这里不做每个变量的显著性检验,是由于变量的稀少以及从表中可以直观地看出每个变量所作的贡献之大。
        MATLAB中利用最小二乘估计得出结果为
        y=93.5843-0.0001x1-8.8820x2
        3. 模型的求解
        模型中得到的两个判别函数正是分别属于两个总体的概率相近表达,将所需变量数据的录入可以直接得出结果从而预测客户违约的可能性,据此概率相近表达又可依据回归函数进行授信额度的估算。
        在此需要说明一下,逐步判别分析中显著性检验中运用统计量F(27,+∞),与我们设定的分位数α=97.5%作比较,过程中所得F检验值为11180.333533,查F分布表知该效果显著。
        在此先对80个待测数据进行违约预测。
        y0=M×A+β 0
        y1=M×B+β 1
        将缺失的重要变量作为剔除变量对待,再次继续逐步判别分析进而得出两个新的判别函数`y0和`y1


        再进而得出新的估算模型`y
        `y=β01x12x 2
        再逐字逐句重复的建立与求解过程即可得出新的模型进行判别和估算。若客户数据刚好缺失这一数据,则认为是人为地剔除了这一变量,其结果与上述建立的模型完全一致。虽然完全一致但表达的意思却完全不同。授信额度估算模型可以帮助企业估算客户的授信额度,模型中从大量的保理数据中对时间窗口变量和上述逐步判别分析中所得的不违约概率相关值进行了线性拟合授信额度的方程,得出的授信额度拟合值与客户的信用额度值有一个大致差值,有时候可以根据这一差值直接粗略估算客户的授信额度。模型中也有不足之处,例如客户信息的缺失值若直接剔除的话有可能导致拟合的判别函数效果大打折扣,例如只有一个相对重要变量时却将这一变量剔除了,显然这是缺乏一定的合理性的。
        结论:
        在客户信息资料齐全时并且所提供的信息全是认为是重要且关键的,那么可以应用逻辑回归模型或者是基于Bayes准则下的判别分析模型来进行预测客户违约的可能性,逻辑回归通过不断地寻找最优解来拟合一个线性函数;判别分析是对Bayes概率的二分类操作,可以建立出判别函数模型从而对违约进行预测。但上诉的模型在数据量庞大且复杂情况下会有其不合理处,因为它们没有对信息进行处理,或者说基于逐步判别分析模型里对所提供信息进行了一个筛选,将不重要的变量信息剔除,这样做在多数时候是更加具有科学性的。而由于每个客户缺失的随机性,这一过程实际上是动态的,是一直存在的,也即总体的效率是比较低的,是不如全引入信息变量的逻辑回归,因此在可以直观地看出所缺失的信息完全是无关紧要的那么可以应用逻辑回归或者是无缺失信息下的逐步判别分析进行操作。
        参考文献:
        [1] 郭科,龚灏,多元统计方法及其应用,成都:成都理工大学

投稿 打印文章 转寄朋友 留言编辑 收藏文章
  期刊推荐
1/1
转寄给朋友
朋友的昵称:
朋友的邮件地址:
您的昵称:
您的邮件地址:
邮件主题:
推荐理由:

写信给编辑
标题:
内容:
您的昵称:
您的邮件地址: