메인메뉴로 이동 본문으로 이동

lnb영역

데이터사이언스
과정

컨텐츠 내용

  1. 수강신청
  2. 과정정보

Case Study - Python Data Descriptive Analysis

과정 이미지
Case Study - Python Data Descriptive Analysis 과정정보
수강기간 30일
강의구성 1차시
담당강사 김원표
수강료 무료
과정소개

 * 본 강의는 데이터캠퍼스 유료회원만 신청이 가능한 과정입니다.

 

유료회원은 이용하고자 하는 케이스 강의를 신청 해주시면 관리자가 확인 후 수강이 가능하도록 조치해 드립니다.

평일 근무시간 기준으로 1시간 이내 수강 가능하며, 주말에는 월요일 오전 중에 수강이 가능하도록 조치해드립니다.

 

######### 과제 소개 ############


본 과제는 Python으로 기초통계분석, 범주화, 교차분석을 수행하는 소과제 풀이 영상입니다. 

데이터사이언스 Python 강좌 중 통계학과 추정, 가설검정, 교차분석의 개념과 원리, 교차분석의 실습과 시각화, 독립표본 t-test분석의 개념과 원리, 독립표본 t-test분석의 실습과 시각화 까지 수강하신 분 중 본인의 실력테스트 및 실전 데이터를 다루는 연습을 하고자 하는 수강생들에게 적합한 과제입니다. 


데이터설명: 국내 대형병원 12,000명의 담낭결석 진료 환자 (실제 데이터, 비식별화를 위한 개인정보 제거)


소과제 내용: 

1. '의학데이터.xlsx'자료를 불러와 연속형 자료에 대해서 기술통계분석을 수행하시오.

1) 연속형 자료에 대한 기술통계량과 히스토그램을 살펴보고 정규분포에서 벗어난 변수가 있는지 판단하시오. 그 이유는?

2) 정규분포에서 크게 벗어나고 한쪽으로 자료가 몰려 있는 변수(3개 변수)를 로그변환(log-transformation)한 후 히스토그램을 다시 그려보시오.

3) 연속형 자료 중 이상치가 있는지 상자수염도표(box-whisker plot)을 이용하여 살펴보시오 (이상치 제거 과정은 생략)


2. '의학데이터’ 데이터셋을 이용하여 다음을 수행하시오.

1) 이완혈압의 기술통계량을 보고 95% 신뢰구간으로 모수를 추정하시오. 그 의미는 무엇인지 설명하시오. 

[주) 95% 신뢰구간의 z통계량은 1.96입니다.]


3. 성별, 연령대, 거주지역에 따라서 담낭결석 환자(유병율) 여부에 차이가 있는지 분석해보시오.

1) 성별에 따른 담낭결석 환자(유병율)의 교차표, 카이검증, 도표를 그려보시오.

2) 연령대에 따른 담낭결석 환자(유병율)의 교차표, 카이검증, 도표를 그려보시오.

3) 거주지에 따른 담낭결석 환자(유병율)의 교차표, 카이검증, 도표를 그려보시오.


4. 성별과 담낭결석유무 집단별 이완혈압의 관계를 분석하시오. 

1) 성별과 담낭결석유무 집단별 이완혈압의  기술통계량 및 상자도표를 그려보시오.

2) 성별과 담낭결석유무에 따라 이완혈압, 담랑결석 환자여부에 따라 이완혈압에 차이가 있는지를 분석해 보시오

학습목표
파이썬을 활용한 기초적 데이터 분석 완성!
강의목차
차시 강의명 학습시간
1차시 Python 핵심 통계량과 검정차이 #2 86분