목록2025/04 (5)
짜리몽땅 매거진
금융 사기 거래 탐지는 끊임없이 진화하는 사기꾼들과의 지능적인 싸움과 같다. 새로운 패턴을 학습하고 대응 방안을 찾는 동안 사기꾼들도 사기 방법을 지속적으로 변화시킨다. 이러한 상황에서는 기존의 접근 방식만으로는 충분하지 않다. 특히 사기 거래의 패턴이 빠르게 변화하고, 레이블링된 데이터가 부족한 상황에서는 더욱 그렇다. 따라서 사기의 새로운 패턴을 빠르게 감지하고 효과적으로 대응할 수 있는 새로운 기술과 방법론을 모색해야 한다. 지난 SMOTE 및 XGBoost 기반 모델에 이어 이번에는 Isolation Forest 기반 신용카드 사기 거래 탐지 모델링 실습을 진행해보자. Isolation Forest 알고리즘에 대한 설명은 지난 포스팅을 참고하자. [Python] 데이터에서의 Outlier 처리데이..
본격적으로 사기 거래 탐지를 위한 모델링을 해보자. 첫 번째로 살펴볼 방법은 머신러닝 지도학습법을 활용한 모델 개발이다. 이 접근법은 레이블링 과정을 거쳐 사기로 분류된 거래 데이터를 사용한다. 이번 실습에서 사용할 데이터셋은 다음과 같다. Credit Card Fraud DetectionAnonymized credit card transactions labeled as fraudulent or genuinewww.kaggle.com 사기 거래는 전체 거래에서 차지하는 비율이 매우 낮아, 이러한 불균형한 데이터 상태에서 효과적인 모델링을 위해서는 특별한 접근 방법이 필요하다. 이를 위해 트리 기반 모델을 활용할 예정이며, 데이터 불균형 문제를 해결하기 위해 SMOTE 기법을 사용한다. SMOTE는 소수..
금융 사기 거래 탐지는 단순희 범죄를 막는 것 이상의 중요성을 가진다. 이는 금융 거래의 신뢰성과 안정성을 보장함으로써, 전반적인 금융 생태계의 건강을 유지하는데 필수다. 사기 거래가 무분별하게 이루어질 경우, 소비자들의 신뢰는 급격히 하락하고, 이는 결국 금융 시장의 불안정으로 이어질 수 있다. 따라서 사기 거래 탐지와 예방은 단순히 개별 기업이나 소비자들을 보호하는 것을 넘어서, 금융 시장 전체의 안정과 성장을 도모하는 중요한 활동이다. 이와 동시에 AI와 머신러닝 기술을 활용한 금융 사기 거래 탐지 방법이 더욱 중요해지고 있다. 이러한 기술들은 대량의 거래 데이터를 실시간으로 분석하여 사기성 거래를 효과적으로 식별할 수 있는 능력을 제공한다. 또한 지속적인 학습과 개선을 통해 새로운 사기 유형에 빠..
OptBinning 라이브러리를 사용해 신용평가 모델링을 하면서 궁금했던 점을 정리해보려 한다. Q1. 변수 구간화(binning)은 왜 하는가?1. 변수와 목표값(y)의 관계를 더 명확하게 만들기 위해원래 연속형 데이터(ex. 소득, 나이)는 y(부도 여부)와 바로 선형 관계를 가지기 어렵거나 노이즈가 많음.binning을 하면 범위별로 평균 부도율이 확연하게 달라짐.binning을 하면 위험 구간 vs 안전 구간이 명확해짐.2. WoE / IV 같은 신용평가 전용 Feature 생성 가능binning을 해야 WoE, IV값을 계산할 수 있다. → WoE를 쓰면 좋은 이유변수와 y의 관계를 log-odds 형태로 정량화 가능outlier 영향 적음선형 모델에 적합→ IV는 변수 중요도 지표로 씀. 정..
지난 머신러닝 기반 신용평가 모델에 이어 이번에는 OptBinning 라이브러리 기반의 신용 평가 모델을 개발해보자. OptBinning 라이브러리는 변수의 binning(구간화)을 최적화해주는 파이썬 기반 오픈소스 라이브러리로, 주로 신용평가 모형 개발이나 머신러닝 feature engineering 과정에서 활용된다. 특히 연속형 변수나 범주형 변수를 적절하게 구간화해서 모델 성능 향상이나 해석력을 높일 때 유용하다. 지난 머신러닝 기반 신용평가 모델링의 전처리 및 시각화 과정까지는 동일하므로 그 다음 단계부터 살펴보자. [금융 AI] AI 기반의 신용 리스크 모델링(3) - 머신러닝 기반 신용 평가 모델머신러닝 기반의 신용 평가 모델링을 진행하고자 두 가지 데이터셋을 준비한다. 아메리칸 익스프레스..