이번 포스팅에서는 무선 절편과 무선 기울기의 개념을 예를 통해 간단히만 다룰 것이다.

 

저번 포스팅에서 데이터가 비독립적일 때 에러 항이 여러 성분으로 나뉘게 된다고 적었다.

그러면서 어떤 이유로 에러가 발생했는지를 연구자가 분석 모형에 명시하는 것이 무선 효과(random effects)와 관련있고,

무선 효과에는 무선 절편과 무선 기울기가 있다고 했다(아래 글 참고).

2023.03.25 - [통계 공부/Linear Mixed Effects Model] - Brauer & Curtin(2018) 논문: 에러 항 구조 비교

 

Brauer & Curtin(2018) 논문: 에러 항 구조 비교

이번 포스팅에서는 데이터가 독립적일 때와 비독립적일 때 에러 항(error term)의 구조가 어떻게 다른지 비교한다. 모든 통계 분석은 아래 그림의 빨간 상자 안처럼 'data = model + error'라는 동일한 기

psstat.tistory.com

 


●연구 예시

이번 논문에서 전반적으로 예를 들 연구를 다시 상기해보자.

 

참가자는 100명이었고, 각 참가자는 명망이 높은 수업과 낮은 수업 2개씩 제출하였다.

그리고 제출한 수업에 대한 선호도를 9점 리커트 척도 상에서 평정하였다.

 

따라서 이 연구의 독립변인은 높고 낮은 두 수준을 갖는 명망이고,

종속변인은 참가자가 제출한 과목에 대한 선호도 평정치이다.

 

 

●무선 절편(random intercepts)

모형이 데이터를 정확하게 예측하지 못하는 이유,

즉 에러가 발생하는 이유 중 하나는 각 참가자의 평균적인 반응이 다를 수 있기 때문이다.

 

앞선 연구 예시에서 A라는 참가자는 대학 생활의 만족도가 높아서 모든 수업에 전반적으로 높은 선호도를 보였다.

반면 B라는 참가자는 모든 수업에 전반적으로 낮은 선호도를 보였다.

 

그러나 고정효과 모형 자체는 이러한 개인차를 반영하지 못한다.

따라서 이러한 평균적인 개인의 반응 차 때문에 모형의 예측도가 떨어지게 되는 것이다.

 

이러한 예시(unit의 평균적인 반응 차에 의해 발생하는 에러를 모형에 명시하는 것)가 무선 절편이다.

여기서는 참가자를 예시로 들었는데,

참가자의 평균적인 반응의 차이 때문에 나타나는 오차를 모형에 포함시킨 경우

참가자 절편, 영어로는 by-subject random intercept를 모형에 추가시켰다고 표현한다.

 

●무선 기울기(random slope)

모형이 데이터를 정확하게 예측하지 못하는 또 다른 이유

참가자마다 독립 변인에 영향을 받는 정도가 다르기 때문일 것이다.

 

예를 들어, C라는 참가자는 명망이 높은 수업과 낮은 수업의 선호도 차이가 2점밖에 되지 않는데,

D라는 참가자는 두 수업의 선호도 차이가 8점일 수 있다.

이 말은 D라는 참가자가 C라는 참가자보다 독립변인의 영향을 더 많이 받았다는 뜻으로,

참가자마다 독립변인의 영향을 받는 정도가 다름을 말한다.

 

위의 예처럼 고정 변인의 효과가 무선 변인의 수준마다 다른 경우 모형에 무선 기울기가 추가되고.

참가자를 예로 들면 명망에 대한 참가자 무선 기울기,

영어로는 by-subject random slope for prestige를 모형에 추가했다고 나타낸다.

 

●무선 에러

무선 절편과 무선 기울기를 모형에 포함시켜도 모형이 데이터를 설명하지 못하는 부분을 무선 에러라고 하는데

여기에는 측정도구의 불안정성이라던지 온갖 것들이 영향을 줄 수 있기 때문에 사실상 연구자가 설명하기 어렵다.

 

 

<잡담>

이렇게 이번 포스팅을 마무리해보았다.

이 포스팅이 무선 절편과 무선 기울기의 개념을 익히시는데 조금이라도 도움이 되었길 바라며

혹시 잘못 기술되었거나 이해가 잘 안가는 부분이 있다면 댓글 달아주시길 바란다!

반응형

+ Recent posts