메인메뉴로 이동 본문으로 이동

컨텐츠 내용

  1. 커뮤니티
  2. 즉문즉답

즉문즉답

즉문즉답 조회 페이지
군집분석에서 군집수 결정에 관한 문의 김원표 / 2020.03.02

#############################################################################################

##  본 Q&A는 과거 운영사이트(snscon.com) Q&A에서 좋은 질문에 대한 답변을 학습 목적으로 재정리하셔 업로드한 것입니다. ##

#############################################################################################


Q. 일반적으로 요인분석 후에 요인들을 통해서 군집분석을 많이 하는 것으로 알고있습니다.

그리고 그 때 군집의 수는 군집분석에 사용한 요인의 수와 같거나 적게 설정한다고 여러 책에서 보았습니다.


그런데 제 자료에서는 요인수보다 1-2개 많게 군집을 설정한 경우에 집단 간 차이가 더 분명하게 제시가 되니까 설명하기도 더 편합니다. (5개 요인에 6개 군집이나 7개 군집)

물론 요인수보다 더 적게 해본 경우도 설명이 나쁜 건 아닙니다. (군집수를 달리했을 때 집단의 빈도분포도 비교적 일정하여 크게 문제되진 않습니다.)


제가 궁금한 것은

1. "일반적으로 군집의 수는 요인의 수보다 적게 한다" 는 말 밖에는 책에서 볼 수 없어서, 꼭 그래야 하는지 궁금합니다. 그래야 한다면 이유를 알려주세요.


2. 집단 간의 명확한 차이때문에 요인수보다 많은 군집수를 채택한다면 다른 사람들의 "일반적으로 군집의 수는 요인의 수보다 적게 한다" 는 지적에 대해서 어떻게 설명을 해야할지 모르겠습니다.

집단의 차이가 가장 잘 나는 군집의 수이기 때문에 선택했다는 설명만으로는 부족한 듯 합니다. 다른 좋은 설명을 좀 부탁드리겠습니다


A. "일반적으로 군집의 수는 요인의 수보다 적게 한다"는 것은 일반적인 경우이지 꼭 그렇지는 않습니다. 요인의 수보다 군집수를 더 많이 하는 경우가 많습니다. 염려하지 않으셔도 됩니다.

군집의 수는 요인의 수보다 적게 한다는 이유는 요인이 기준이 되기 때문에 여러 기준으로 가늠된 한 군집이 해석이나 특징이 잘 잡히기 때문입니다.

그러나 선생님의 경우처럼 군집수가 더 많은 데에도 불구하고 더 군집의 특성이 명확하다면 이는 문제가 되지 않습니다.

정리하면 "일반적으로 군집의 수는 요인의 수보다 적게 한다"는 이유는 그렇게 여러 기준(요인)으로 표현된 군집을 형성해야 그 군집의 특성을 명확히 하려는 노력입니다.

그럼에도 반대의 경우라 할지라도 잘 표현된다면 문제 없습니다.