메인메뉴로 이동 본문으로 이동

lnb영역

커뮤니티

컨텐츠 내용

  1. 커뮤니티
  2. 합격후기

합격후기

합격후기 조회 페이지
데캠 덕분에 빅분기 실기 고득점 합격! 이*성 / 2022.01.17
빅데이터분석기사결과.JPG

데이터캠퍼스 덕분에 제3회 빅데이터분석기사 실기를 고득점으로 합격할 수 있었습니다. 동 회차 합격인 만큼 너무 너무 기분이 좋습니다.


제3회 빅데이터분석기사 필기에 합격하고 필기교재에서 수록되어있었던 R언어로 독학하다가 도저히 안되겠다 싶어서 고민하던 중 데이터캠퍼스를 알게 되었습니다. 수강료도 만만치 않았기 때문에 수강할까 말까 많이 고민하였지만 결과론적으로는 데이터캠퍼스에서 빅분기 실기 강좌를 수강해서 정말 다행이었다라는 지금와서 듭니다. R이든 파이썬이든 기초지식이 전무했기 때문에 그나마 필기공부 때 배운 R에서 파이썬으로 갈아탄다는 것이 불안하기도 하였지만 김원표 교수님께서 처음부터 차근차근 잘 알려주셨기 때문에 강좌를 들으면 들을수록 불안감이 안정감으로 변화해갔네요. 강좌 중 제 뇌에 가장 꽂힌 김원표 교수님의 말씀은 주피터노트북을 가지고 이것저것 해보면서 놀아보아야 한다!라는 말이었습니다. 정말 그 말을 철썩 같이 믿고 실기 강좌 연습 파일 이외로 다양한 파일들을 불러오기 시작했습니다. 빅분기 시험 몇 달 전에 사경환 교수님의 사회조사분석사 2급 실기를 공부하면서 다운로드 받은 파일들을 대상으로 SPSS에서 되는 것들을 파이썬 코드로도 할 수 있게 하자라는 마인드로 많이 가지고 놀았습니다. 역시, 처음 가지고 놀 때는 아직 노는 방법이 미숙하여 파일이 로딩되지 않거나 이상하게 로딩되거나 분할 파일을 하나로 합치는 과정에서 오류가 생기는 등 많은 어려움으로 끙끙 앓기도 했지만 그러한 과정들이 전부 실력이 되었던 것 같습니다.


빅분기 실기 준비를 위해 약 두 달 동안 매일 최소 4~5시간은 투자하였고 강의는 매일 2개 정도 듣는 것을 목표로 하였습니다. 강좌가 총 47차시 정도 있기 때문에 한 달 이상의 여유를 가지고 공부하면 강좌만으로도 충분히 따라갈 수 있다고 생각합니다. 강좌를 듣는 1~2시간을 제외하고는 주피터노트북을 가지고 노는 시간에 투자하였습니다. 가지고 놀다 보니까 궁금한게 생기고 코드가 돌아가지 않는 것이 생기고 먹통이 되는 것이 생기는 등 개인적으로 파이썬에 대해서 공부하게 되었습니다.


빅분기 실기 단답형의 경우, 필기를 공부하셨다면 추가적인 공부시간 투자 없이도 준비가 가능할 것이라고 생각합니다. 제 개인적인 견해일지도 모르나, 이번 제3회 빅분기 실기 단답형은 문제의 지문이 다소 애매하게 느껴지거나 조금 감이 안 잡혀서 높은 점수를 받지는 못했습니다. 참고로, 빅분기 자격증을 노리고 계시다면 ADsP를 먼저 도전해보시고 빅분기 필기를 공부하시는 것을 추천해드립니다.


빅분기 작업형 제1유형은 빅데이터분석이나 통계에 대한 검증이 아니라 "너 파이썬(또는 R) 다룰 줄 아니?"라는 질문에 더 가까웠던 것 같네요. 따라서, 데캠 강좌를 들으면서 파이썬을 다루어봤다면 충분히 풀 수 있다고 생각합니다. 단, 답안 제출하실 때 하드코딩은 지양해주세요.


제가 데이터캠퍼스에서 강좌를 결제하게 된 결정적 이유는 작업형 제2유형 때문이었습니다. 어떻게 준비해야 할 지 막막했으니까요. 김원표 교수님께서 처음에는 코드의 전반적인 흐름을 보여주고 그 다음 분석기법에 따라 특정 코드의 틀을 반복하도록 교재를 구성해주셔서 나중에는 분석기법 패키지만 보고도 어떻게 돌아가겠구나가 예상이 될 정도로 학습효과가 좋았습니다. 다만, 제가 가장 걱정했던 부분은 시간부족이었습니다. 시간부족이나 코딩실력부족에 대한 고민 때문에 몇 몇 수험자분들 중 랜덤포레스트만 돌려서 기본점수획득만을 목표로 하시는 분들이 많으신 것으로 생각합니다. 앞으로 빅분기 실기 난이도가 올라갈 것으로 예상되는 것만큼 김원표 교수님의 말씀처럼 꼭 주피터노트북으로 놀아보고 각 코드들을 자기 것으로 만들어야 어떤 문제가 나와도 대처가 가능하다는 생각이 듭니다. 저 같은 경우에는 실기 시험일을 약 10일 정도 앞두고 그 동안 데캠에서 배운 지식들을 바탕으로 가장 간결한 코드를 제 나름대로 만들어보려고 노력하였습니다. 그래서 제 스타일로 변수명들을 통일하고 특정 규칙으로 간소화한 다음에 파이썬의 리스트형과 딕셔너리형을 활용하여 패키지를 추가하거나 파라미터를 조정해도 추가되는 코드 이외로 수정해야 하는 코드가 최소화되도록 하였습니다. 맨 마지막에는 for문을 이용해서 자동으로 가장 예측을 잘 하는 분석기가 선택되도록 하였습니다.


빅분기 실기 예제문제를 풀면서 ROC 스코어가 매번 낮게 나와 걱정했었는데 ROC 스코어 올리는 방법은 딱 3가지로 압축되는 것 같습니다. 첫 번째, 변수 전처리를 아주 잘 할 것! 특히, 저는 명목형 변수를 더미화하지 않고 오즈비로 변환해서 사용하였습니다. 랜덤포레스트에서는 별 차이가 나지 않지만 다른 분석기에서는 아주아주 큰 차이를 가져오니 명목형 변수에 대해 오즈비 변환을 추천해드립니다. 두 번째, 과적합에 주의하라! 빅분기 실기 끝나고 랜덤포레스트만 돌려보니 ROC 스코어가 0.8 이상으로 정말 높게 나와서 그냥 제출하셨다는 분들이 많으시더라고요. ROC 스코어가 높으면 좋은게 아니라 과적합이라는 김원표 교수님의 말씀을 유념해서 처음 데이터셋을 분할할 때, 훈련용/검증용/시험용으로 나누어 사용했습니다. 물론, 시험자 본인이 ROC 스코어를 확인할 때는 한 번 더 분할하여 사용한 데이터셋으로는 ROC 스코어가 높게 나오지 않겠지요 (저 같은 경우에는 ROC 스코어가 0.7을 겨우 넘겼던 것으로 기억합니다). 세 번째는 어느 정도 파라미터를 조정할 것. 저는 무조건 마지막에는 파라미터를 조정하는 시간을 확보한다는 마음가짐으로 저만의 간결한 코드를 만들어 갔습니다.


앞으로 데캠을 수강하실 분들께서도 꼭 김원표 교수님께서 강의 중간중간 해주시는 짤막한 조언과 함께 빅분기 실기를 잘 준비하셔서 좋은 결과 있으시길 기원합니다. 

read 페이지 바
이전 글 이전 글이 없습니다.
다음 글

3회 합격후기입니다.

 파일첨부  
2022.01.14