1、不同年龄层次对于贷款的需求情况,贷款的主要集中年龄层
首先查询年龄层分布情况,使用代码:
select max(age),min(age) from loan得出结果如下图: (, 下载次数: 0)
上传
点击文件名下载附件
可以明显看出,男性占客户群体中占比达八分之八十以上,贷款的最主要群体应该针对男性进行客户获取,但同时男性群体的逾期率要高于女性10%,也可以说比女性多了30%的逾期可能性,可以从更丰富的维度,去分析男性和女性逾期群体的特征,看能否增强风控降低逾期。
3、贷款人群中学历分布以及不同学历间的逾期率情况
代码:
SELECT education as '学历',COUNT(education)AS'人数', concat(round(count(education)*100/(SELECT count(*) FROM loan),2),'%') AS'占比', count(past_due_days)AS'逾期人数', concat(round(count(past_due_days)*100/count(education),2),'%')AS'逾期占比' FROM loan GROUP BY education得出信息情况:
学历为college、High School or Below占贷款人的绝大部分比例,Master or Above贷款人占比及其小,学历越高贷款需求越小,主要客户群体为本科以下学历人员。
从不同学历的逾期率情况看,除Master or Above其它三类并无太大差别,但Master or Above数据量太少可忽略不计,所以可以认为,学历高低对逾期情况并无太大影响。
4、贷款期限选择情况
代码:
SELECT terms AS'贷款期限',count(terms)AS'人数', concat(round(count(terms)*100/(select count(*) FROM loan),2),'%')AS'占比', count(past_due_days)AS'逾期人数', concat(round(count(past_due_days)*100/count(terms),2),'%')AS'逾期占比' FROM loan GROUP BY terms ORDER BY floor(terms) ASC得出信息情况: