메인메뉴로 이동 본문으로 이동

컨텐츠 내용

  1. 커뮤니티
  2. 즉문즉답

즉문즉답

즉문즉답 조회 페이지
로지스틱 회귀분석 적합도 해석 문의입니다 김원표 / 2020.03.02

#############################################################################################

##  본 Q&A는 과거 운영사이트(snscon.com) Q&A에서 좋은 질문에 대한 답변을 학습 목적으로 재정리하셔 업로드한 것입니다. ##

#############################################################################################



Q. 로지스틱회귀 분석에서 아래의 표를 보고 적합도를 판정한다고 하는데(-2Log우도 부분을 보고 판정한다고 들었습니다. cox와 snell의 r제곱이나 Nagelkere r제곱은 로지스틱 모형에서는 별로 의미가 없다고 우도비가 중요하다고)

밑에 설명이 있기는 한데 설명이 어려워서 적합하다는 건지 아닌지 모르겠습니다.

아래 표 두 개를 어떻게 해석해야 할까요?


-2 Log 우도  Cox와 Snell의 R-제곱  Nagelkerke R-제곱

   66.967               0.493                    0.668

 

모형 계수 전체테스트

                  카이제곱   자유도   유의확률

1 단계  단계   68.650       12        .000

          블록   68.650       12        .000

          모형   68.650       12        .000


모형의 적합도를 나타내는 -2 Log 우도는 67.0으로 상수항만으로 구성된 모형에 비하여 독립변수들이 포함됨으로써 모형의 적합도가 68.7만큼 더 높아졌다.


A. 위의 통계량만을 보았을 때는 전체적으로 모형이 적합한 수준입니다.

다만 이보다 분류표에서 몇%의 자료를 정확하게 분류했는지가 로지스틱과 판별분석 등에서 현실적으로 더 중요합니다.

즉 정확분류도표를 추가해서 정분류 확률을 반드시 제시해야 합니다. 

로지스틱 회귀분석에서는 유사R제곱이나 모형 유의성보다는 정확분류확률을 더욱 중시합니다

따라서  00%의 설명력(분류정확도)을 보였다...라고 표현하는 것이 좋습니다.