목록2024/06/05 (2)
짜리몽땅 매거진
데이터 스케일링이란 데이터 값의 스케일(범위)를 조정해주는 것이다. 피처 별로 값의 스케일이 다르다면, 머신러닝이 제대로 작동하지 않을 수 있기 때문에 데이터 스케일링 작업을 해주어야 한다. 데이터 스케일링은 주로 회귀 모델에 적용된다. 1. Standard Scaler데이터의 평균을 0, 분산을 1이 되도록 즉, 표준 정규분포를 따르드록 스케일링한다.from sklearn.preprocessing import StandardScalerStandardScaler = StandardScaler()df_mm = StandardScaler.fit_transform(x) #스케일링 작업, x는 종속변수x_mm = pd.DataFrame(data= df_mm, columns=x.columns) #스케일링된 값으로..
주식 데이터는 복잡한 숫자와 통계 정보를 보유하고 있다. 따라서 그래프나 차트를 통해 주가의 변화 추이를 한눈에 파악할 수 있다. 실시간으로 변동하는 주식 시장에서는 신속한 의사 결정이 중요한데, 시각화된 데이터는 빠르게 정보를 전달하고 분석할 수 있도록 도와준다. 위와 같은 주식 데이터 시각화 필요성에 따라 주식 데이터를 가져오는 법과 가져온 주식 데이터를 Tableau를 활용해 차트로 시각화해보았다.1-1. 구글 스프레드 시트로 주식 데이터 수집하기 =GOOGLEFINANCE() : Google Finance에서 현재 또는 과거 유가증권 정보를 가져오는 함수 [각 파라미터 설명]ticker고려할 유가증권에 대한 시세 표시attribute - [선택사항]Google Finance에서 ticker에 대해..