서울여자대학교 2023-1 머신러닝기반데이터분석 Final Project
뮤지컬 입문자를 위한 뮤지컬 추천 유형 고안
- 뮤지컬에 관심이 있으나 작품 선정에 어려움을 가지는 입문자
- 이미 몇번 관람한 적 있으나 작품 선정에 어려움을 가지는 자
- 2023.06.03 셀레니움 이용해 크롤링 함수 초안 완성
- 2023.06.04 크롤링 뮤지컬 기준 설정 및 전반적인 정보 정리
- 2023.06.05 크롤링 완료, 크롤링 함수 일부 문제 수정 (캐스팅 정보 존재하지 않는 경우 해결)
- 2023.06.06 뮤지컬 정보 수집 및 정리
- 2023.06.10 크롤링 데이터 전처리(데이터 concat 및 특수문자 등 제거), 형태소 분석기 이용하여 명사, 형용사 분리, 워드클라우드 생성
- 2023.06.11 stopwords 제거, 워드클라우드 재생성
- 2023.06.12 리뷰 키워드 10개씩 추출, word2vec 형성
- 2023.06.13 클러스터링 진행, 7개의 유형 분류 + 한가지 유형을 두개로 분류하여 총 8개로 유형 분류