메인메뉴로 이동 본문으로 이동

lnb영역

데이터사이언스
과정

컨텐츠 내용

  1. 수강신청
  2. 과정정보

Case Study-Python Textmining Sentiment Analysis & Clustering

과정 이미지
Case Study-Python Textmining Sentiment Analysis & Clustering 과정정보
수강기간 30일
강의구성 1차시
수강료 무료
과정소개

 

 * 본 강의는 데이터캠퍼스 유료회원만 신청이 가능한 과정입니다.

 

유료회원은 이용하고자 하는 케이스 강의를 신청 해주시면 관리자가 확인 후 수강이 가능하도록 조치해 드립니다.

평일 근무시간 기준으로 1시간 이내 수강 가능하며, 주말에는 월요일 오전 중에 수강이 가능하도록 조치해드립니다.

 

######### 과제 소개 ############


본 과제는 Python으로 Text 자료에 대한 감성분석(긍/부정, Score도출), 하위 군집분석, 하위 주제 찾기(토픽모델링)을 수행하는 소과제 풀이 영상입니다. 


데이터사이언스 Python 강좌 중 Sentiment Analysis 개념 및 활용, Sentiment Analysis 실습, Text Clustering 개념 및 활용, Word Clustering 실습, Document Clustering 실습, LDA와 Topic Modeling 개념 및 활용, LDA 분석과 결과의 해석, LDA 결과의 시각화 까지 수강하신 분 중 본인의 실력테스트 및 실전 데이터를 다루는 연습을 하고자 하는 수강생들에게 적합한 과제입니다. 


데이터설명: 영화별 소개(줄거리)에 대한 텍스트 데이터


소과제 내용: 

1. ‘movies_metadata.xlsx'자료를 불러와 Sentiment Analysis를 수행하시오

1) 영화 개요에 해당하는 overview 항목을 분석하고자 한다. overview 항목을 title 이라는 새로운 변수로 생성한 후  불용어, 특수문자 등의  전처리를 수행하시오.

2)  영화 개요를 이용하여 감성분석(Sentiment Analysis)을 수행하시오


2. ‘movies_metadata.xlsx'자료를 불러와 Clustering을 수행하시오

1) Clustering을 수행하고, 유사한 군집이 어떻게 형성되었는지 파악하시오

2) LDA방법을 적용하여  영화개요의 적절한 Topic 수를 결정하면서 LDA 결과를  해석하시오. 그 결과 어떤 유사한 영화군들의 키워드가 형성되는지 파악하시오

3) Clustering기법과 LDA 기법 중 어떤 것이 영화 개요 유사 군을 파악하는 데에 적합한지 판단하시오

Python을 활용한 선형회귀분석의 개념과 원리, 선형회귀분석의 실습과 시각화, 더미회귀분석의 개념과 원리, 더미회귀분석의 실습과 시각화, 로지스틱회귀분석의 개념과 원리, 로지스틱회귀분석의 실습과 시각화

학습목표
텍스트의 유사 내용(주제)별로 군집화 및 토픽모델링 방법 100% 익히기!
강의목차
차시 강의명 학습시간
1차시 Python 텍스트마이닝 감성분석과 클러스터링 강좌 #6 60분