简单观察|你中招了吗?,信用卡欠款918.75亿!多家银行发布最严风控( 二 )
1、去重复值
通过去除重复值节点将重复行的数据进行给去除 , 结果去除后结果如图2-9所示 。
由于“家属数量”缺失较少 , 可直接使用中位数进行填充 。 “月收入”这个特征对于征信来说非常重要的 , 本案例采用随机森林填补法来填充 , 即将缺失的特征值作为预测值 , 将未缺失的“月收入”数据作为训练样本的标签 。 流程图如图2-10所示 。
根据探索分析发现年龄的最小值为0 , 通常我们知道年龄小于18岁是不能办理银行信用卡或者贷款业务的 , 并且发现三个逾期天数指标(逾期30-59天、逾期60-80天 , 逾期90天)是存在比较严重的离群值的 。 通过行选择节点筛选出年龄<18的数据分析发现仅有年龄=0的这一条数据 , 如图2-11所示 。 因此需要将年龄为0的数据进行删除过滤 , 如图2-12所示 。
推荐阅读
- 武契奇|塞尔威亚总统武契奇:我在白宫捍卫了和中国的关系
- ipo观察|李书福的身价能赶超马克斯吗?,吉利汽车IPO后
- 女性健康|女生发际线后移怎么回事,多跟这6件事有关,有很多人都中招了
- 网红美食|网红甜点椰丝球自己动手做,简单零失败,甜丝丝的吃不胖
- 中国新闻网|服贸会观察:区块链为何能成全球贸易“助推器”?
- 【】服贸会观察:区块链为何能成全球贸易“助推器”?
- 央视网|新闻观察:北京自贸区呼之欲出 实施好营商环境改革4.0系列政策措施
- 川报观察|邻水这个贫困户把院子变成了花园 还从东北“摇”回一个媳妇儿
- 徐婷|4年前,徐婷在北京全身溃烂而亡,其实背后不只是患癌这么简单
- 澎湃新闻|全球城市观察︱搬回父母家,疫情期间“回巢”的美国年轻人
