ANOVA Regression
독립변인 자료유형 범주형 연속형
종속변인 자료유형 연속형 연속형

 

이번 시리즈에서는 대비 코딩을 다룬다!

위의 표에 기술하였듯

일반적으로 독립변인의 자료유형이 범주형이고 종속변인의 자료유형은 연속형일 때는 분산분석(ANOVA)을,

독립변인과 종속변인이 모두 연속형일 때는 회귀를 실시해야 한다고 알려져있다.

 

하지만 데이터를 분석하다보면 독립변인이 범주형임에도 회귀식을 사용하는 경우가 종종 생긴다.

사실 ANOVA도 선형모형의 일종으로, 회귀의 특수한 버전이라고 생각하시면 된다.

 

어쨌든 독립변인이 범주형인데 회귀를 돌리려면,

독립변인을 더미변인(dummy variable)이라는 것으로 변환하는 작업이 필요하다.

이렇게 독립변인을 더미변인으로 변환하는 것을 대비 코딩이라고 한다.

 

대비 코딩도 여러 종류가 있는데 본 시리즈에서는 우리 분야에서 많이 사용되는

더미 코딩(dummy coding 또는 treatment coding)과 효과 코딩(effect coding 또는 sum-to-zero coding)을 다룬다.

 

'저는 어떤 코딩을 사용해야 하나요?'라는 질문이 떠오를 터

이에 대한 답변은 '연구물음을 고려해서 결정하세요'이다.

 

일단 대비 코딩 시리즈의 첫 포스팅이니까 간단하게 여기까지만!

반응형

+ Recent posts