목록2023/12/29 (1)
짜리몽땅 매거진
[Python] 마켓컬리 리뷰 전처리, 워드클라우드 시각화
그동안 배운 pandas 문법을 사용해 마켓컬리 리뷰로부터 자주 언급되는 단어를 추출해 인사이트를 도출하기 위한 전처리 작업을 진행해보았습니다. 시각화는 각 토큰화 단어와 전체 문장 길이의 직관적 비교를 위한 [히스토그램]과 최빈 노출 단어 파악을 위한 [워드클라우드]를 출력했습니다. 각 시각화 그래프는 어떻게 출력됐으며, 어떤 인사이트를 뽑아낼 수 있는지 차근히 살펴보겠습니다. (1) 기초 작업 import pandas as pd data = pd.read_csv('마켓컬리 리뷰.csv') 우선 판다스를 import하고 마켓컬리 리뷰 데이터를 불러옵니다. 데이터는 이렇게 5개의 칼럼과 490개의 행으로 구성되어있는 것을 알 수 있습니다. df = data[['상세제품명','리뷰내용']] df['리뷰내용..
Data/Python
2023. 12. 29. 15:31