목록2024/06/25 (4)
짜리몽땅 매거진
![](http://i1.daumcdn.net/thumb/C150x150/?fname=https://blog.kakaocdn.net/dn/c3gjTK/btsH9fhqmzO/oTfxyhF227kWgtAyDusssk/img.png)
지난번 Feature Selection 기법 중 Model-agnostic Explanation Method이자 XAI(Explainable AI)에 해당하는 SHAP과 LIME에 대해 다룬 적 있었다. 오늘은 Catboost 모델을 활용해 금산인삼축제 성패를 예측한 LIME Value 데이터를 태블로 상에서 '생키 차트'로 시각화해보자. 생키 차트는 각 단계별 값의 변화를 한 눈에 표현하기 위한 목적으로 사용한다. 특히, 전체 값이 어떤 곳으로 흘러가는지 혹은 어떤 단계에서 얼마나 많은 값이 이동하는지도 한눈에 파악할 수 있는 효과적인 시각화이다. 태블로에서는 생키 차트를 표현하는 방법을 표현 방식으로 제공하고 있지 않기 때문에 이를 표현하기 위해서는 몇 가지 과정이 필요하다.0. 데이터 준비 및 연결..
![](http://i1.daumcdn.net/thumb/C150x150/?fname=https://blog.kakaocdn.net/dn/bqOKo5/btsIb21s8YE/5L8WqWU3BkjFwpIG1lfPSk/img.png)
금산인삼축제와 금산천벚꽃축제에 대한 전반적인 여론과 인식을 파악하고자 해당 축제명을 네이버에 검색했을 때 뜨는 뉴스기사 리스트를 크롤링한 후 크롤링한 기사의 제목을 네이버 CLOVA Sentiment API를 활용해 감성분석해보자. 먼저 네이버 뉴스기사를 크롤링해보자.1. 라이브러리 호출import pandas as pdimport numpy as npimport timeimport refrom bs4 import BeautifulSoupfrom datetime import datetimefrom tqdm import tqdmimport requestspath = "/Users/your name/Desktop/" 2. 검색 키워드 및 개수 설정# 필요한 키워드 입력search_content = input..
![](http://i1.daumcdn.net/thumb/C150x150/?fname=https://blog.kakaocdn.net/dn/bif7s9/btsH90qe16r/juW7S0ECsM1ElnHPCImULk/img.png)
연도별 구인인원, 구직건수, 취업건수를 태블로에서 Radial Bar 차트로 시각화해보자. 0. 데이터 불러오기데이터를 태블로에 연결하고, 해당 시트를 다시 유니온으로 결합한다. 1. 계산된 필드 만들기(1) Path Order :원래 데이터는 0, 추가된 데이터는 1 로 합니다. 그리고 측정값에서 차원으로 변환한다.IIF([테이블 이름]="구인구직 동향", 0, 1) (2) Radial Field: [Trip Duration] 2. 매개변수 만들기(1) Radial Inner (2) Radial Outer3. 계산된 필드 (또) 만들기(1) Radial Angle(INDEX()-1)*(1/WINDOW_COUNT(COUNT([Radial Field])))*2*PI() (2) Radial Normalize..
![](http://i1.daumcdn.net/thumb/C150x150/?fname=https://blog.kakaocdn.net/dn/qwYdq/btsIb3TzXOw/kVcFQNF9v525UxmKw8kHw1/img.png)
하이퍼파라미터 튜닝은 머신 러닝 모델의 성능을 최적화하는 중요한 과정이다. 하이퍼파라미터는 모델 학습 전에 설정되는 파라미터로, 학습 과정 자체를 제어한다. 이러한 하이퍼파라미터의 적절한 조정은 모델의 성능을 크게 향상시킬 수 있다. 하이퍼파라미터 튜닝의 중요성하이퍼파라미터 튜닝은 모델의 성능을 최대화하고, 과적합을 방지하는 데 중요하다. 특히, 대규모 데이터셋과 복잡한 모델에서 하이퍼파라미터의 영향이 크기 때문에, 적절한 튜닝 과정을 거치는 것이 중요하다. 이 과정은 시간과 자원이 많이 소모되기 때문에, 효율적인 방법을 선택하는 것이 중요하다. car_evaluation 샘플 데이터셋을 활용해 랜덤포레스트 모델링을 한 뒤, 하이퍼파라미터 튜닝을 진행해보자.1. 모델링from sklearn.ensembl..