목록2024/04 (10)
짜리몽땅 매거진
KNN 알고리즘과 K-means 클러스터링과 같은 머신러닝의 기초적인 모델들은 모두 거리기반 측정을 바탕으로 시작한다. KNN 알고리즘의 경우 가까운 속성에 따라 분류한다고 했는데 '가깝다'는 것에는 기준이 필요하다. 나중에 KNN 알고리즘에 대해 자세히 다루겠지만, KNN 알고리즘은 거리기반 분류분석 모델로 거리를 기반으로 분류하는 알고리즘이며 따라서 상대적으로 거리가 더 짧은 이웃이 더 가까운 이웃으로 취급된다. 즉, KNN 알고리즘은 어떤 새로운 데이터로부터 거리가 가까운 K개의 다른 데이터의 레이블(속성)을 참고하여 K개의 데이터 중 가장 빈도 수가 높게 나온 데이터의 레이블로 분류하는 알고리즘이다. K-means 알고리즘에서 K는 묶을 군집의 개수를 의미하고 means는 평균을 의미한다. 단어 ..
문제1. 레스토랑 웨이터의 팁 분석출처 : solvesql 연습문제문제 정보 : 난이도 2 / 정답률 44.53%https://solvesql.com/problems/tip-analysis/ 정답 쿼리select day, time, round(avg(tip),2)as avg_tip, round(avg(size),2)as avg_sizefrom tipsgroup by day, timeorder by day, time 문제 해설1. 주요 포인트 1 - round, avgselect day, time, round(avg(tip),2)as avg_tip, round(avg(size),2)as avg_size 팁과 일행 수의 경우 날짜와 시간대에 따라 평균값으로 집계 후 소수 둘째 자리까지만 표현해야하므로 ro..