论文范文网-权威专业免费论文范文资源下载门户!
当前位置:毕业论文格式范文>专科论文>范文阅读
快捷分类: 财务风险论文 资产评估论文题目 金融风险管理论文 企业财务风险的分析和防范论文 资产评估论文 企业财务风险论文 风险评估论文 安全风险评估论文 自我风险评估论文 项目风险评估论文 论文保险公司风险评估 环境风险评估论文

关于风险评估类硕士论文范文 和P2P网人违约风险评估基于决策树相关毕业论文格式模板范文

分类:专科论文 原创主题:风险评估论文 发表时间: 2024-03-09

P2P网人违约风险评估基于决策树,本文是风险评估相关在职开题报告范文与决策树和风险评估和借款人类在职开题报告范文.

摘 要:借款人违约风险是P2P网贷风险的核心.运用Lending Club2017年第一季度的交易数据,采用信息增益比率标准,对P2P网人违约风险的影响因素进行排序.结果显示,借款收入比、信用等级、借款期限、借款利率、住房情况,是前5个影响借款人违约风险的因素.据此,构建风险评估模型,对P2P网人的违约风险进行评估,分析其影响因素和风险评估模型的有效性,并为P2P网贷行业的风险控制和有效监管提出建议.

关键词:P2P网贷;违约风险;决策树;风险评估模型

一、引言

当前,我国P2P网贷发展迅速.2017年,我国P2P网贷成交额为6.23万亿元,与同期13.53万亿元新增人民币贷款之比为46.07%.然而,在P2P网贷迅速发展的同时,其风险也在行业内部不断集聚.

2014年至今,我国P2P网贷平台累计数量,从757家上升至6183家,而正常运营平台仅为1836家,大量平台破产、倒闭.在P2P网贷众多风险中,借款人违约风险及其控制是P2P网贷平台及行业今后健康发展的关键(王书斌等,2017).[1]

二、文献概述

(一)P2P网贷研究的热点

借款人违约风险评估,是目前国内外P2P网贷研究的热点之一.其实证研究大多利用分类器工具,算法主要包括决策树、Logistic模型、支持向量机、神经网络等.然而,国内外学者基于不同算法的借款人违约风险实证研究结果,却显示出较大的差异性.

唐剑琴(2016)认为,信用等级、借款利率、债务收入比、借款期限、收入认证等因素,对借款人的违约风险有较大影响.[2]

王程龙等(2016)则认为,借款人年龄、借款金额、借款人职业、担保及视频认证情况,是影响借款人违约风险的重要因素.[3]

(二)P2P网贷研究的趋势

不同算法的比较分析和集成策略模型构建,成为目前及今后的研究趋势.

Malekipirbazari(2015)通过比较不同的机器学习方法,认为随机预测在识别优质借款人方面,明显优于FICO评分和LC等级鉴定.[4]

阮素梅等(2017)利用“人人贷”的交易数据,分别构建基于决策树和支持向量机算法的借款人违约风险评估模型.结果显示,在考虑误差成本的情况下,决策树模型更优.[5]

丁岚等(2017)利用“人人贷”的交易数据,以Logistic回归、决策树、支持向量机为初级学习器,以支持向量机为次级学习器,构建基于Stacking的集成策略评估模型,预测P2P网贷中借款人的违约风险,显示出良好的效果.[6]

然而,目前基于分类器的借款人违约风险评估模型的变量设置尚有待进一步研究,这主要是因为在数据的预处理上存在分歧.本研究在数据预处理上区别于以往研究,在一定程度上改善了模型的预测效果.

三、实证分析

(一)模型选择

1.常用模型

目前,在P2P网人违约风险评估研究中,常用的模型主要包括,Logistic模型、支持向量机、神经网络、决策树等.然而,各模型均有不足之处.

2.决策树算法

决策树算法的基本思想,是按照一定的分割规则,自上而下对总体进行不断地分割,最后按照多数法原则确定分类结果.这种算法实质上体现的,是分类对象属性变量与分类结果之间的一种映射关系.决策树模型结合了传统统计分析和人工智能算法,在保留了非参数统计一些优点的同时,又克服了其不足之处.

总之,决策树算法具有自动选择变量、降维、充分利用先验信息,有效处理非同质数据关系等优点.其得到的违约分类结果,是一个树状结构,具有可解释性强、简单易懂的优势.基于此,本研究选择决策树为分类算法.

(二)数据来源与预处理

1.数据来源

成立于2007年的LendingClub,是美国规模最大的P2P网贷平台,其借款人信用等级采用FICO信用评分模型.由于在美国强监管的市场环境下,LendingClub中的借款人信息具有较高的质量,因此,本研究采用LendingClub的交易数据.

2.数据预处理

2017年第一季度,Lending Club共产生133887条交易记录.原始数据共有146个特征变量,去除无关变量与高度相关变量,选取的主要违约风险变量,涵盖借款信息和借款人信息共19个,具体如表1所示.

表1:违约风险变量与借款状态

表1中的loanstatus,即贷款状态分为:chargedoff(冲销)、current(流通)、default(违约)、fullypaid(全部付讫)、ingraceperiod(宽限期内)、late16~30days(超期16~30天)、late31~120days(超期31~120天)七类.鉴于超期意味着一定程度的违约,本研究视冲销、违约、超期16~30天、超期31~120天为违约,全部付讫视为未违约.

经过数据抽取和缺失值处理后,得到一个包含51360条记录的数据集.其中,违约记录15924条,占31%;未违约记录35436条,占69%.鉴于此数据集的不平衡性,需对其进行平衡处理.采用对少数样本的过抽样方法,将违约样本完整复制,得到31848条违约记录.此时,总样本为67284条记录.

(三)特征变量选择

在数据预处理中,P2P借款状态被划分为“违约”“未违约”两类,即模型的因变量.而该数据集的自变量(特征变量)较多,尽管这样信息更充分,但同时数据集的冗余,也会相对影响模型的分类效果.

根据最大表决原则,将最多计数的类别作为此叶子节点.利用机器学习软件Weka3.8(怀卡托智能分析环境),采用信息增益比,对特征变量进行选择.特征变量的排序结果,如表2所示.

根据表2的信息增益率指标排序结果,最后选择dti、grade、term、int_rate、home_ownership、verification_status、inq_last_6mths、revol_util、annual_inc、installment、purpose共11个特征变量作为建模变量.

(四)决策树模型的建立与模型的有效性检验在Weka软件中,选用J48决策树算法,建模时间为1.63秒,正确分类率为71%,错误分类率为28%,因此具有较强的预测能力.

在进行信用评估时,正确的预测既可降低风险又可扩大收益.而实际构建的分类模型,往往会把实际存在信用风险的借款人,错误预测成不存在违约风险的借款人;把实际不存在违约风险的借款人,错误预测成存在违约风险的借款人.因此根据每类错误的成本不同,混淆矩阵将各种预测结果都统一归入一个矩阵中,方便全面解读模型的预测能力.决策树模型混淆矩阵如表3所示.

从表3可看出,该模型测试了67282个样本,其中预测正确的48090条,实际违约而预测为未违约6767条,实际未违约而预测为违约12425条,即犯第一类错误的概率较小,犯第二类错误的概率较大.总体而言,该模型具有良好的预测效果,但同时反映出模型尚具有改善的空间.

四、结论与建议

(一)结论

采用信息增益比率标准,对P2P网人违约风险影响因素进行排序,利用决策树分类算法,对违约风险评估模型进行构建和评估.研究结果显示,借款收入比、信用等级、借款期限、借款利率、住房情况,是前5个影响借款人违约风险的因素,这与目前的研究结论大体相似.

同时,该模型也显示出良好的预测效果,准确率达到71%.值得注意的是,模型的预测准确率尚具有提高的空间和必要性,这需要对数据进行更深入的处理.

(二)建议

1.政府角度

为了提高P2P网贷的效率并降低违约率,应开放并完善征信系统,将借款人相关的信用信息录入互联网平台.具体措施是:

第一、要完善并贯彻实施信用档案登记制度,确保每一笔信用信息都记载在册,有据可查.

第二、要加强信用立法与执法,提高人们对信用的重视和关注程度.

2.P2P平台角度

第一、应准确录入和审核客户,以保证借款人信息的高质量和准确性.

第二、P2P平台之间应互通客户信用数据库,实现信息共享.

第三、加强技术建设,不断升级平台信息服务系统.一方面,要不断更新平台信息系统,为优化违约风险评估模型提供强有力的数据支持;另一方面,聘用高素质的数据挖掘和分析人才,以及风险控制和管理人才等技术人才,以更好地支撑P2P网贷平台业务的发展.

参考文献:

[1]王书斌,谭中明,陈艺云.P2P网贷违约风险及其传染性评估综述[J].武汉金融,2017(6):40-44,14.

[2]唐剑琴.基于决策树算法的P2P网人违约风险度量研究[D].长沙:湖南师范大学(硕士学位论文),2016.

[3]王程龙,陈程.基于决策树的P2P网贷平台信用评级体系研究[J].农村金融研究,2016(12):45-50.

[4]MalekipirbazariM.,AksakalliV..Riskassesentinsociallendiniarandom forests[J].ExpertSystemswithApplications,2015,42(10):4621-4631.

[5]阮素梅,何浩然,李敬明.P2P借贷中借款人的违约风险评估———基于“人人贷”数据的实证分析[J].经济问题,2017(12):45-50,99.

[6]丁岚,骆品亮.基于Stacking集成策略的P2P网贷违约风险预警研究[J].投资研究,2017(4):41-54.

作者简介:沈玉溪,湖北工业大学经济与管理学院,硕士研究生,研究方向为互联网金融;徐浩,湖北工业大学经济与管理学院,硕士研究生,研究方向为民间金融.

该文汇总:这是一篇关于对写作决策树和风险评估和借款人论文范文与课题研究的大学硕士、风险评估本科毕业论文风险评估论文开题报告范文和相关文献综述及职称论文参考文献资料有帮助.

参考文献:

1、 基于结构方程模型的P2P网络平台借贷风险因素分析和评估模型设计 【摘要】P2P网络借贷平台的持续健康发展对我国经济市场的稳定有重要影响 本文从系统功能域角度,分析了引起P2P网络借贷平台借贷过程中的主要风险因素,设计了一种基于结构方程的P2P网络平台借贷风险评估模.

2、 基于贝叶斯网分类器的互联网借贷风险评估 一、前言  “互联网”和大数据的时代背景下,信贷行业在数据挖掘和云计算的技术主题下呈现爆发式增长 它促进资金优化配置,缓解市场信息不对称……问题,满足中小微企业对融资服务的需求.

3、 基于P2P网贷平台的互联网金融风险管理 摘要互联网金融作为传统金融的有益补充,在促进金融经济发展的同时,也存在一些不稳定因素 特别是一些P2P网贷平台发展过程中面临风险,有效规避其风险要做好借款人的信用调查;加强相关法律体系建设;提升防范信.

4、 水稻高温热害与其风险评估进展 杨舒畅,申双和(南京信息工程大学应用气象学院,南京210044)摘要中国是世界上最大的水稻生产国和消费国,水稻生产对粮食安全具有极其重要的意义 随着全球气候变暖的加剧,高温热害已成为影响水稻生产的主要.

5、 艺术品保险:风险评估和审查 简家鼎(Khadinn Khan)全球风险评估方案GRASPGRASP产生的背景是2004年伦敦艺术品仓库发生了一起大火,价值超过1亿美元的艺术作品,比如像“YBA”(Youn.

6、 基于AHP和熵权法的林浆纸供应链风险评估 彭红军,王苗苗 (南京林业大学 经济管理学院,南京 210037)摘 要针对林浆纸供应链的风险问题,建立基于林业企业节点风险、制浆造纸企业节点风险和林浆纸供应链资源流风险的风险评估体系,并运用层次分.