짜리몽땅 매거진
[금융 AI] AI 기반의 신용 리스크 모델링(5) - QnA 본문
OptBinning 라이브러리를 사용해 신용평가 모델링을 하면서 궁금했던 점을 정리해보려 한다.
Q1. 변수 구간화(binning)은 왜 하는가?
1. 변수와 목표값(y)의 관계를 더 명확하게 만들기 위해
- 원래 연속형 데이터(ex. 소득, 나이)는 y(부도 여부)와 바로 선형 관계를 가지기 어렵거나 노이즈가 많음.
- binning을 하면 범위별로 평균 부도율이 확연하게 달라짐.
- binning을 하면 위험 구간 vs 안전 구간이 명확해짐.
2. WoE / IV 같은 신용평가 전용 Feature 생성 가능
binning을 해야 WoE, IV값을 계산할 수 있다.
→ WoE를 쓰면 좋은 이유
- 변수와 y의 관계를 log-odds 형태로 정량화 가능
- outlier 영향 적음
- 선형 모델에 적합
→ IV는 변수 중요도 지표로 씀.
정리하면, 신용평가 모델링은 '원천 데이터 → 구간화(optbinning 등) → WoE/IV 변환 → Logistic Regression → 신용평가 모형' 순으로 진행됨.
Q2. 신용평가 모델 모니터링은 구체적으로 어떤 원리인가?
OptBinning의 ScorecardMonitoring 클래스는 PSI기반으로 신용평가 모델 모니터링을 자동화하는 도구임.
1. 왜 모니터링할까?
신용평가 모델은 아래와 같은 이유로 시간이 지날수록 성능이 약해질 수 있음.
- 고객 특성 변화 (데이터 드리프트)
- 경제 상황 변화
- 신규 고객 유입 패턴 변화
→ 모델 예측력 떨어짐 → 재개발 or 재점검 필요
2. PSI (Population Stability Index)란?
모델 개발시점 vs 모델 적용시점 데이터 분포 차이를 수치화한 값으로 PSI값이 0.1 이하인 경우, 모델의 분포가 안정적이라고 판단하며, 0.1에서 0.25 사이면 경미한 변화가 있음을, 0.25 이상이면 모델의 분포가 크게 변화했음을 의미하. 위험 구간의 값이 나올 경우 모델 점검 또는 재개발의 신호등 같은 역할이라고 보면 됨.
'Data > Financial AI' 카테고리의 다른 글
[금융 AI] AI 기반 금융 사기 탐지(2) - SMOTE & XGBoost 기반 신용카드 사기 거래 탐지 모델 (0) | 2025.04.17 |
---|---|
[금융 AI] AI 기반 금융 사기 탐지(1) - 금융 사기 거래 탐지의 중요성과 AI (0) | 2025.04.14 |
[금융 AI] AI 기반의 신용 리스크 모델링(4) - OptBinning 기반 신용 평가 모델 (0) | 2025.04.10 |
[금융 AI] AI 기반의 신용 리스크 모델링(3) - 머신러닝 기반 신용 평가 모델 (0) | 2025.03.29 |
[금융 AI] AI 기반의 신용 리스크 모델링(2) (0) | 2025.03.13 |