加入收藏 | 设为首页 | 会员中心 | 我要投稿 李大同 (https://www.lidatong.com.cn/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 编程开发 > Python > 正文

网贷祸害了多少家庭?风险多大?通过Python数据分析识别网贷风险

发布时间:2020-12-17 01:10:39 所属栏目:Python 来源:网络整理
导读:本文基于决策树算法设计和构建一个简洁的信贷审批模型,实现自动化和智能化量化和识别风险。前一段时间,是经常刷到某某机构贷款多少,某某学生因为违约金而跳楼自杀?学生由于经济压力还不起,网贷公司就越来越催着还款,其实国家是有法律的,只要利息或者

本文基于决策树算法设计和构建一个简洁的信贷审批模型,实现自动化和智能化量化和识别风险。前一段时间,是经常刷到某某机构贷款多少,某某学生因为违约金而跳楼自杀?学生由于经济压力还不起,网贷公司就越来越催着还款,其实国家是有法律的,只要利息或者违约金不超过多少,是不需要偿还这么多的资金的,小编也偷偷的查过一些网贷公司,确实很坑,我碰到过那种借三百还四百的,前提条件是没有逾期,这个霸王条约是真的恐怖,所以小编也在这里劝大家,最好不要去接触这个网贷,学生的话,没钱可以和家里沟通,和同学沟通,没必要非得深陷进去,进去了就很难拔出来了,还有很多的女大学生搞什么裸贷,女生还是以自己的名誉为主,虚荣心虽然很难满足,但是可以通过自己的双手来让自己的生活过的更好,好了咱们废话不多说,来到咱们的主题!

结论:

进群:125240963 ?即可获取数十套PDF,如果需要源码请给小编留言!

  • 1 数据集拥有1000个样本和17个特征
  • 2 特征集是数值型和因子型的组合
  • 3 特征集源自信贷或者信贷人

  • 贷款期限跨越4个月到72个月,中位数是18个月
  • 贷款金额从250DM到18424DM,中位数是2320DM

5 目标变量分布

table(credit$default)

** 结论**:

  • 30%的违约率

第三步:数据准备

1 数据集划分

数据集划分为训练集和测试集。

或者 利用caret包的createDataPartition()函数,进行分层抽样,90%为训练集,10%为测试集。

第四步:建立模型

使用C50包里面的C5.0决策树算法。

** 结论**:

决策树规则集前三行(见红色方框)的规则策略:

  • 如果checking account balance 是大于 200DM或者 Unknown,则可能不违约
  • 如果checking account balance 是小于 0DM 或者 在1-200DM之间,并且credit history 是perfect 或者very good,则可能违约

summary(C50_model)会显示混淆矩阵,还会指明训练模型的错误率,如下图所示:

** 结论**:

  • 训练模型的错误率:14.8%

决策树算法通常存有过拟合问题。因此,需要对模型做优化处理,然后在测试数据集上面评估模型性能。

第五步:评估模型

测试数据集评估模型性能。

** 结论** :

  • 测试数据集100个样本,错误率是27%。测试数据集上面模型表现的性能比训练数据集上要差
  • 测试集上面对于违约情况的召回率是42%,这类错误是严重的错误,会导致银行损失

解决方案:

模型性能调优

第六步:优化模型性能

1 超参数调优

C5.0算法通过自适应提升改进C4.5算法。在C5.0函数里面,通过超参数trials设置。

** 结论**:

  • 测试数据集的错误率是18%,相对于前面模型,改善了9%的错误率
  • 测试集上面对于违约情况的召回率是61%,相对于前面的模型,提升了19%的命中率

2 错误类型的代价分析

对不同类型的错误,赋予不同的代价值

  • 设计错误代价矩阵

** 结论**:

  • 测试集上面对于违约情况的召回率是79%

所以大家还是远离一些非法机构的网贷,要找肯定也要找上市公司有保障的,这样的公司是不会有非法的暴利收取手续费的,劝勉大家最好是远离网贷,谢谢大家阅读!

(编辑:李大同)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

    推荐文章
      热点阅读