메인메뉴로 이동 본문으로 이동

컨텐츠 내용

  1. 수강신청
  2. 과정정보

Case Study-Python Machine Learning Clustering & Outlier Detection

과정 이미지
Case Study-Python Machine Learning Clustering & Outlier Detection 과정정보
수강기간 30일
강의구성 1차시
수강료 무료
과정소개

 

 * 본 강의는 데이터캠퍼스 유료회원만 신청이 가능한 과정입니다.

 

유료회원은 이용하고자 하는 케이스 강의를 신청 해주시면 관리자가 확인 후 수강이 가능하도록 조치해 드립니다.

평일 근무시간 기준으로 1시간 이내 수강 가능하며, 주말에는 월요일 오전 중에 수강이 가능하도록 조치해드립니다.

 

######### 과제 소개 ############


본 과제는 Python으로 머신러닝 중 군집화(Clustering, DBSCAN) 알고리즘을 이용해 수행하는 소과제 풀이 영상입니다. 

데이터사이언스 Python의 머신러닝 강좌 중 Clustering, DBSCAN 까지 수강하신 분 중 본인의 실력테스트 및 실전 데이터를 다루는 연습을 하고자 하는 수강생들에게 적합한 과제입니다. 


데이터설명: :game_auto.csv (진짜 게임자용자 구분하기 데이터: 일반인 / 단순한 오토(봇) / 작업장)


소과제 내용: 


1. game_auto.csv 파일을 이용하여 K-Means Clustering을 수행하시오     (모든 계산은 euclidian으로 진행하시오)

  1) 데이터를 Standard Scaler를 이용하여 표준화하시오

  2) K의 범위를 1~9까지로 하여 Average within-cluster sum of squares 값을 구하고 그래프를 작성하시오

  3) K의 범위를 1-9까지로 하여 Percentage of variance explained 값을 구하고 그래프를 작성하시오

  4) Eigen Values와 Eigen Vectors를 구하시오

  5) Cluster 값을 3으로 하고 Max Iteration을 10000으로 하여 K-means clustering을 수행하시오

  6) 만들어진 K-means Clustering predict 결과와 종속변수인 bot 변수를 이용하여 Confusion Matrix를 작성하시오

  7) Silhouette-score를 계산하시오 


2. game_auto.csv 파일을 이용하여 DBSCAN을 수행하시오 (모든 계산은 euclidian으로 진행하시오)

  1) 1번 과제에서 Standard Scaler로 표준화된 데이터 프레임을 이용하여 2번 과제를 수행하시오

  2) EPS를 1, 샘플링 갯수를 최소 5개 이상으로 DBSCAN을 수행하시오

  3) DBSCAN 분석을 통해 도출된 예측 데이터를      'predict'라는 이름으로 기존 표준화된 데이터 프레임에 열로 추가하시오.

  4) 종속변수인 'bot'열과 'predict'간 교차분석을 수행하시오

  5) 분석한 결과를 토대로 PCA 그래프를 그리시오


학습목표
Python으로 머신러닝 알고리즘 중 군집화/이상치탐색 100% 수행하기!
강의목차
차시 강의명 학습시간
1차시 Python 머신러닝 군집 및 이상탐지 강좌 #12 37분