清华大学金融科技研究院孵化
金融科技与金融创新全媒体

扫描分享

本文共字,预计阅读时间

摘要:尽管借贷企业历来看重借款人的学历水平,但对学历与借贷的深入探讨却较为缺乏。借助新颖的P2P数据,本文从两个方面提出假说并展开研究:从借款者违约结果方面,高学历借款者是否违约概率较低;从投资者投资决策方面,投资者是否更愿意借钱给高学历借款者。实证结果表明,高学历借款者如约还款概率更高,高等教育年限增强了借款人的自我约束能力,但是,投资者却并未亲睐高学历借款人,在通过教育程度识别信用风险的行为上存在偏差。

关键词:教育程度;信用识别;P2P借贷

JEL分类号:G21; G23; I29 文献标识码:A 文章编号:

一、引言

教育投入是个人规划乃至国家政策中举足轻重的一环,而关于教育价值的评估也一直广受关注。以往关于教育回报的学术研究多集中在劳动力市场上:例如,一些学者认为高学历的劳动者更可能获得高工资。那么其他市场是否能准确识别学历的价值呢?本文将从借贷市场这一重要方面着手研究。

借贷市场的实务操作历来重视借款者的学历水平。在我国商业银行个人信用评价体系中,学历水平是非常重要的一项指标,以1999年建设银行制定的我国首部个人信用评价办法为例,文化水平被列为评价申请人的必要步骤。在国外借贷市场中,教育水平重要性也常被提及。在对美国多家借贷企业进行实地调研的过程中,我们发现,一家专注学生贷款的互联网金融企业SoFi极具代表性,其运营的基本假设即为从好学校毕业的学生是低风险的。

然而,与业界对学历指标的重视极不相符的是,针对学历与借贷的深入探讨少之又少。高学历的借款者风险真的低吗?投资者青睐高学历借款者呢?在现有的文献中,回答这些问题的经验证据非常有限。究其原因,在传统的银行借贷中,数据难以获得,可能对该问题进行大样本实证探讨构成了限制。而新兴的P2P平台海量公开的个人借贷数据,提供了包括学历变量在内的丰富的借款者信息,为我们研究借贷市场上学历的价值提供了前所未有的宝贵契机。

P2P借贷在国内也被称为人人贷,是广受关注的一种互联网金融商业模式。P2P借贷从英文的P2P Lending(Peer-to-Peer Lending或Person-to-Person Lending的简称)翻译而来,是指有剩余资金的投资人借助网络平台,以不通过银行等传统金融机构的形式,把钱借给有资金需求的贷款申请人。由于没有银行等传统金融机构的参与,P2P借贷通过降低交易成本使投资人获得了更高的收益,同时也降低了借款人的借款成本。P2P借贷近年来步入了爆发性增长期。从国际经验看,自2005年以来,以Zopa、Prosper、Lending Club为代表的P2P借贷平台在欧美兴起。由于欧美国家的居民信用信息获取环境较为完备,P2P行业得以迅速发展。P2P借贷于2007年左右正式进入中国,而2010年之后,随着利率市场化、银行脱媒以及民间借贷的火爆,P2P借贷呈现出爆发性发展的态势,大量的P2P平台在市场上涌现,在社会上,引起了广泛的关注和热议。

本文通过收集我国P2P行业代表性企业人人贷(renrendai.com)的数据,研究个人借贷中教育程度在信用识别方面的作用,探究借贷市场能否准确识别学历的价值。具体而言,本文将从两个层面研究学历对于个人贷款的影响,一是,从借款者违约结果方面,借款者的教育程度与真实违约率的关系,即学历较高的借款人是否更倾向于如约还清贷款;二是从投资者投资决策方面,投资者是否认可借款者的教育程度,即投资者是否更愿意借钱给学历较高的借款人,由此可以看出P2P市场上的投资者在通过教育程度识别信用风险的行为是否存在行为偏差。

实证结果表明,一方面,受教育程度较高的借款者的实际违约率却显著较低,事实上,高等教育年限深刻影响着借款者的某些行为特征,这些行为特征增加了借款者的自我约束能力。另一方面,借贷市场上的投资者并未对受教育程度较高的借款者表示出明显青睐,个人借贷市场上的投资者通过教育程度识别信用风险的行为存在偏差。

本文的创新之处在于:一是,利用了新颖的P2P平台数据,创新的探讨了教育在借贷市场的作用。在P2P数据之前,个人贷款数据主要存在与银行体系内部,由于数据可得性的局限,教育在借贷市场作用的研究十分少见;二是,研究发现,教育在潜移默化中规范着受教育人的行为,降低了受教育人借款时的违约概率。这一发现从新的角度支持了教育有用性,为建立健全征信体系时评估学历价值提供了有益参考。三是,本文从两个层面衡量借贷情况(投资者投资决策与借款者违约结果),两相对比,指出投资者在对借款人学历作用的认识上存在偏差,有助于引导大众通过合理理财实现个人财富的保值增值。

下文的结构安排如下:第二部分回顾了现有相关文献;第三部分提出了研究假说;第四部分描述了本文所用数据情况;第五部分介绍了实证设计和结果;第六部分总结。

二、文献综述

(一) 教育作用的相关文献

教育回报是一个重要的问题,它既关系到如何解释一些国家曾出现过的受教育程度不同的劳动者收入差距加大的现象,又涉及到如何决策人力资本投入以便更好的促进经济增长。大量文献探讨教育投入在劳动力市场的回报问题。受教育较多的劳动者在劳动力市场上更可能在劳动力市场上得到更高的报酬(Card, 2001; Harmon and Walker, 1995; Ashenfelter and Krueger, 1994; Butcher and Case, 1994)。此外,也有一些论文探讨教育程度与公民意识方面的关联。例如,Milligan et al.(2004)探讨了教育程度与政治参与度之间的关系,研究表明受教育程度越高的公民,政治兴趣越浓,公投参与率越高。

由此可见,现有有关教育作用的研究多集中在对劳动力市场的探讨上,而研究教育程度在个人借贷市场作用的文献十分少见。借贷市场是劳动力市场之外,对于个人、企业、国家都非常重要的另一市场,那么,教育程度在个人借贷市场上发挥着怎样的作用呢?

几位学者通过组织调研,分析调研数据,得到了一些有关借贷市场与教育水平的结论。Sharpe et al.(2012)收集了2008年的中国消费金融与投资者教育调研数据,研究发现,受教育程度较高的受访者更可能持有信用卡。Gathergood(2012)分析了英国消费信贷市场调研数据,指出受教育程度较低的借款者更容易过度负债。需要注意的是,此类研究多基于调研数据,无法涉及借款者的实际违约情况及出借方的实际投资决策,阻碍了更进一步深入探讨借贷市场上教育水平的相关课题。

借贷市场能准确识别学历的价值吗?具体而言,高学历借款人的违约率是否更低?高学历借款人是否更容易融资成功?现有文献并未给出解答。究其原因,传统银行借贷中,借款人信息较难为研究者所得,限制该课题的实证研究。然而,P2P个人借贷市场的出现,提供给研究者海量公开数据,其中包含了大量借款人信息。为研究借贷市场上教育的价值提供了前所未有的契机。

(二) P2P领域的相关文献

P2P网络借贷行业在全球范围内方兴未艾,与之对应的对P2P行业的学术研究也处在探索的阶段。风险识别问题无疑是P2P领域研究的核心要点。各国学者尝试从多个角度探究P2P平台上能够识别借款人风险的因子。

一些文献研究了基础的人口特征在信用识别中的作用。Barasinska and Sch?fer(2010)研究了贷款申请人的性别对在德国P2P平台Smava上融资成功率的影响,其研究结果不支持个人借贷市场上存在性别歧视的说法。Herzenstein et al.(2008)利用美国P2P平台Prosper的数据,探讨了P2P平台上性别、种族和婚姻状况的对融资结果的影响。Pope and Sydnor(2011)研究了种族对融资成功率及利率水平的影响,结果表明借贷市场存在对非裔违约率的系统性低估。Duarte et al.(2012)在P2P平台上发现长相更可信的人更容易融资成功,进一步的,这些人也确实信用分数较高,违约率较低。

另一些文献探讨了借款者在P2P网站上所表现出的特有表征在信用识别中的作用。Lin and Viswanathan(2013)发现网上金融投资领域存在本地偏好现象(Home Bias)。Iyer et al.(2009)发现P2P市场有信用甄别的能力,在给定的信用级别内,投资者有能力推断出同一信用级别内信用差别(由信用分数捕捉的)的三分之一。Michels(2012)验证了自愿的、不被验证的信息披露降低了借款成本。Herzenstein et al.(2011)探讨了P2P平台上借款者描述语言的作用。Larrimore et al.(2011)进一步检验语言运用和P2P平台上借款成功的关系。Berger and Gleisner(2009)认为P2P平台上的群主可以通过减少信息不对称,显著的提高借款者的信用质量,尤其是对信用不佳的借款者而言,群主的金融中介作用更为明显。Lin et al.(2013)着重衡量P2P平台中好友的作用。结果显示,更强更确实的朋友联系会带来融资成功率的提高,违约率的降低,利率的降低。Everett(2008)从组群角度出发,检验了网上借贷的违约风险。当组群成员在真实生活中有联系的时候,加入组群会显著的降低违约风险。Liu et al.(2013)利用我国拍拍贷的数据,验证了不同类别朋友的作用。李悦雷等(2013)利用拍拍贷的数据,分析了订单借款额完成率、订单投标人数、满标订单成交利率的影响因素和投资者羊群行为的特征。

现有文献为我们研究P2P平台的风险识别问题提供了有益的借鉴,然而也存在一些改进空间,主要体现在:一是,现有研究对象多以国外平台为基础,以我国P2P平台为研究对象的揭示我国独有特征的文章较为少见;二是,并未就教育程度对识别借款人风险的作用问题给出研究结论。而教育问题在我国尤其受到重视,于是教育程度在借贷市场上的作用问题在我国有着更为重要的研究价值。

三、 假说提出

我们关心的第一个问题是高学历借款人的信用风险情况。据此,我们提出两个相对的假说:

假说1:在控制其他因素后,P2P平台上的高学历借款人信用风险较低,违约率较低。

假说1背后的逻辑是,高等教育不仅教授了知识,使得高学历人群收入较高,更重要的是,高等教育潜移默化中培养了学生的自律精神和信用操守。因此,在控制了其他变量(包括收入变量)后,高学历本身仍表征了这类人群的较为守信的行为特征。而这一假说是可被验证的:如果假说1发挥着主要作用,则在控制了其他变量后,高学历借款人应表现出较低的违约率。

假说2:在控制其他因素后,P2P平台上的高学历借款人信用风险较高,违约率较高。

假说2与假说1是竞争性的对立关系。假说2背后的逻辑是,P2P市场的融资成本相对较高,一般而言,高学历的借款者资质较好,拥有更优融资渠道的可能性更大,在这样的假设下,仍旧选择P2P平台的高学历借款人更可能是不得已而为之,因此,P2P平台中的高学历借款人面临的道德风险可能更大,甚至有可能比P2P平台中学历较低的借款人更易违约。 所幸这一假说是可被验证的:如果假说2发挥着主要作用,则在控制了其他变量后,高学历借款人应表现出较高的违约率。

我们关心的第二个问题是投资者是否对高学历借款人的信用风险进行了合理预判。据此,我们提出了两个相对的假说:

假说3:P2P平台上的投资者通过学历判断借款人信用风险的行为不存在偏差。

假说4:P2P平台上的投资者通过学历判断借款人信用风险的行为存在偏差。

假说3与假说4存在竞争性的对立关系。两者可通过实证研究加以验证。如果在控制其他因素后,高学历借款人信用风险较高且投资者并未亲睐高学历借款人,或者,高学历借款人信用风险较低且投资者亲睐高学历借款人,则假说3得到支持。如果在控制其他因素后,高学历借款人信用风险较高但投资者亲睐高学历借款人,或者,高学历借款人信用风险较低但投资者并未亲睐高学历借款人,则假说4得到支持。

四、 数据描述

本文搜集了人人贷网站(www.renrendai.com)的借贷数据。人人贷是我国P2P行业的典型代表之一,于2010年5月成立,2010年10月正式上线,累计为30余省份的几十万客户提供网上借贷服务,近年来发展迅速。为避免网站成立初期测试性数据的干扰,本文选取的样本时间为2011年1月1日至2013年10月18日。由于人人贷所设立的实地认证标、机构担保标等类别与P2P的典型形式信用认证标在担保方式、信息核实方式上有明显不同,所以本文仅将信用认证标作为研究主体。最终本文的样本中包含74831个投标记录,其中67287个投标借款失败,在成功借款的投标中,最终455个借款最终违约(455=104+351),具体情况如下表1所示。

(一) 被解释变量

独特的数据样本可供我们从两个层面探讨借款的结果:是否如约还清与是否成功借款。是否如约还清反映的是借款人的最终行为结果,是借款人信用风险的真实揭露;是否成功借款反映的是投资者对于借款人该笔借款的认可程度,是投资者观点的集中体现。将借款结果分为两个层面探讨的好处之一是可以将两个层面的研究结果相互对比,进而得到投资者认知与借款人真实风险的差别。与前文提出的假说相对应,是否如约还清是假说1与假说2的验证中的核心变量,而是否成功借款是假说3与假说4的验证中的重要变量。

构造的哑变量如约还清,衡量成功融资且已到期的借款是否如约还清。若目前人人贷显示的借款状态为已还清,则哑变量如约还清取值为1,若借款状态为逾期或已由人人贷垫付,则该哑变量取值为0。如表中所示,发标借款成功率为10.07%,最终如约还清率为92.79%。

构造的哑变量成功借款,衡量发标是否融资成功。若目前人人贷显示的借款状态为借款失败,则哑变量成功借款取值为0,若目前人人贷显示的借款状态为还付中、已还清、逾期、或已由人人贷垫付(对于一些逾期时间过久的借款,人人贷会进行垫付),则哑变量成功借款取值为1。

(二) 关键变量

学历相关变量是本文的关键变量。表2针对借款人的学历进行了统计,在申请借款的样本中,拥有本科学历的借款人占比 17.32%,拥有研究生及以上学历的借款人占比1.3%。根据2010年我国第六次人口普查数据,我国(港澳台之外)具有大专及以上学历的人口占总人口 的8.93%。因此,参与P2P网络平台的借款人学历普遍高于社会平均水平。在借款成功的样本中,拥有本科学历的借款人占比24.11%;在如约还清的样本中,拥有本科学历的借款人占比24.84%。

本文以哑变量本科生及以上作为基准变量,并使用其他学历相关变量作稳健性检验,这些变量的构造规则如下。构造的哑变量本科及以上,衡量借款人是否拥有本科及以上学历,若借款人学历为本科或研究生及以上,则该变量取值为1,否则取值为0。构造的哑变量研究生及以上,衡量借款人是否拥有研究生及以上学历,若借款人学历为研究生及以上,则该变量取值为1,否则取值为0。构造的哑变量大专及以上,衡量借款人是否拥有大专及以上学历,若借款人学历为大专及以上,则该变量取值为1,否则取值为0。构造的分类变量学历等级,将1-4的数值赋予高中或以下、大专、本科、研究生及以上四类学历等级,该变量取值越大,则学历程度越高。

(三) 控制变量

要较为准确的探讨学历对于个人借贷的影响,应首先控制其他因素对借贷结果的影响。表2显示,相比申请借款样本,借款成功样本和如约还款样本中的高学历借款者占比较大。但是,通过这样简单的描述性统计并不能推出高学历借款者在借贷市场中受到亲睐的结论。这是因为,在未控制其他变量时,不能单纯地提炼出学历因素在借贷市场中的作用。换言之,具有某些特征的借款者更可能拥有高学历,在探究高学历对借款成功率或如约还清率的影响时,需首先有效控制这些特征。表3通过t检验指出,按照性别、借款额度、借款期限、借款利率、借款人年龄、工资水平或已通过人人贷认证种数分组,两组间拥有本科及以上学历的借款者占比明显不同。这意味着,在下文的回归分析中,需先纳入这些变量为控制变量后,再进行检验。

备注:本表格使用的是申请借款样本。

控制变量主要包括借款特征和借款人特征两类。借款特征包括借款金额、借款期限、借款利率等;借款人特征包括借款人年龄、性别、婚姻状况、收入情况、认证情况等。从表4中可以看出,在申请借款的样本中,借款金额的均值为5.18万元,借款期限的均值为10.91个月,借款利率均值为年化15.78%。借款人年龄均值为29.57岁,女性占比14%,已婚人士占比48%。相比之下,借款成功样本和如约还清样本中的借款者借款金额较小、期限较短、利率较低、年龄较大、已婚者较多。

人人贷网站设置了7个区间供借款人描述自己的收入情况。在申请借款的借款人中,0.73%的借款人月收入不高于1000元,7.23%的借款人月收入处在1001-2000元之间,45.1%的借款人月收入处于2001-5000元之间,24.89%的借款人月收入处于5001-10000元之间,10.37%的借款人月收入处于10001-20000元之间,6.42%的借款人月收入处于20001-50000元之间,5.25%的借款人月收入高于50000元。构建取值1-7的分类变量收入等级,收入越高,取值越大,用以通过分级的方式刻画借款者月收入的差异。

借款人需要向网站提供相应的信用认证材料。认证分为很多种类,在本文的样本期内,借款人可自愿选择进行更多认证。选择认证的种数,某种程度上反映了借款人信用披露以及披露意愿的情况。具体而言,认证的种类覆盖居住地证明、信用报告、购车认证、购房认证、结婚认证、手机认证、视频认证、微博认证、工作证认证、收入认证等各个方面。对于某项认证,若通过认证,则该项认证哑变量取值为1,若未通过认证或未认证,则该项认证哑变量取值为0。构建分类变量已通过人人贷认证种数,令其取值为各项认证哑变量加总之和。在下文的基准回归中,我们选取了借款人已通过人人贷认证的种数作为控制变量,在稳健性检验中,我们尝试了用各项认证哑变量取代认证种数,来表征认证方面的特征,所得的主要结论一致。

五、 实证结果

本文的实证部分主要回答两个问题。首先,我们探究如约还款与教育程度的关系,即高教育程度的借款人是否信用风险较低,拥有更高的如约还款率。据此可以判断出假说1与假说2哪个发挥着更主要的解释作用。其次,我们探究成功借款与教育程度的关系,即高教育程度的借款人是否会受到投资人的青睐,拥有更高的借款成功率,由此可以看出P2P平台上的投资人是否在通过教育程度判断借款人信用风险方面,是否具有行为偏差。据此可以判断出假说3与假说4的真伪情况。

在回归过程中,需要控制借款情况和借款人情况的相关变量。其中,借款情况包括借款额度、借款期限、借款利率、借款利率的平方;借款人情况包括性别、年龄、是否已婚、工资水平、已通过人人贷认证种数。

上述Probit回归模型可用如下公式表示:

Pr(如约还款|教育程度,借款情况,借款人情况)=Ф(教育程度,借款情况,借款人情况);

Pr(成功借款|教育程度,借款情况,借款人情况)=Ф(教育程度,借款情况,借款人情况);

(一) 基准回归

本文的基准回归部分使用Probit模型,采用哑变量本科及以上(详细介绍见数据描述部分的相关变量定义)作为借款人教育程度的衡量指标。表5汇报了如期还款与教育程度的回归结果,表6汇报了成功借款与教育程度的回归结果。

表5中被解释变量为哑变量如约还款。第一列未加入控制变量,哑变量本科及以上前系数的点估计为0.322,在1%的水平下显著,这意味着,在未控制其他变量的情况下,接受过大学教育的借款人更倾向于如约还款,信用风险较低。第二列加入了借款情况和借款人情况的控制变量,哑变量本科及以上前系数的点估计为0.265,在1%的水平下显著,这意味着,即使控制了其他变量,教育程度较高本身会对借款人的信用风险产生影响,使其违约率降低,如约还款率上升,即支持假说1,不支持假说2。

表6中被解释变量为哑变量成功借款,第一列为不加控制变量的回归结果,第二列为加入控制变量后的回归结果。第一列中哑变量本科及以上前系数的点估计为0.262,在1%的水平下显著,这意味着,在不控制其他变量的前提下,看似高教育程度的借款者更容易得到融资。然而,第二列中哑变量本科及以上前系数的点估计为-0.00406,统计上不显著异于0,这意味着,在控制了借款情况和借款人情况等变量后,教育程度较高本身并未使投资者对该借款人青眼有加。

从各个控制变量前系数的情况看,借款额度越高,借款期限越长,越不容易借款成功。一定程度上借款利率越高,越容易借款成功,但是借款利率太高,可能意味着较高的信用风险,反倒不容易借款成功。因此,借款成功率与借款利率大小成倒U型关系。女性借款人更容易成功融资,年龄稍长的借款人更容易顺利借款。借款人工资水平较高、通过的人人贷信用认证种类越多,成功借款的概率较大。

联系表5和表6中针对教育程度的回归结果,可以看出,借款人的高学历本身并未受到P2P平台上投资者的亲睐,这些拥有高学历的借款人事实上如约还款概率更高,信用风险较小。这意味着,P2P平台上的投资者在通过教育程度判断借款人信用风险方面存在行为偏差,即支持假说4,不支持假说3。

[Source]

本文系未央网专栏作者发表,属作者个人观点,不代表网站观点,未经许可严禁转载,违者必究!

本文为作者授权未央网发表,属作者个人观点,不代表网站观点,未经许可严禁转载,违者必究!

本文版权归原作者所有,如有侵权,请联系删除。

评论


猜你喜欢

扫描二维码或搜索微信号“iweiyangx”
关注未央网官方微信公众号,获取互联网金融领域前沿资讯。