LMEM 분석을 할 때는 기존 ANOVA를 분석할 때와는 다르게 데이터를 코딩한다.

 

어떻게 코딩하는지 살펴보기에 앞서 가상의 실험을 먼저 생각해보자.

 

이 연구에서 연구자는 100명의 참가자에게 가장 명망(prestige) 높은 수업과 명망 낮은 수업 각각을 2개씩 제출하게 하고,

제출한 수업에 대한 선호도를 9점 리커트 척도 상에서 평정하게 했다. 

 

이 연구에서 독립변수는 명망이 될 것이고,

명망이라는 독립변수는 높은 수준과 낮은 수준을 갖는 범주 변인이다.

종속변수는 선호도 평정치이다.


본 논문에서 소개하는 데이터 구조화 방법은 크게 두 가지이다.

첫 번째는 wide format이고, 두 번째는 long format이다.

 

이제 각각을 살펴보자.

<데이터 구조>

●wide format

위에 있는 사진이 wide format으로 기존 ANOVA를 사용하던 사람들에게 좀 더 친숙한 형태일 것이다.

wide format의 특징은 참가자 한 명의 반응이 한 행으로만 기록되는 것이다.

 

앞선 연구 예에서 참가자가 100명이었기 때문에 데이터가 100행에서 끝나는 것을 알 수 있다.

 

●long format

long format의 특징은 각 참가자의 반응이 한 줄씩 기록되는 것이다.

 

앞선 연구 예에서 참가자는 4개의 자극에 반응을 했으니 한 참가자 당 4개의 행이 나올 것이다(빨간 네모처럼).

참가자는 총 100명이었으니, 데이터 끝이 400행인 것을 알 수 있다(100 x 4).

 


<각 format에서 분석>

●wide format에서 분석

앞선 연구 예시에서 wide format에서 분석하는 방법은 두 가지가 있다.

한 참가자가 두 조건에 대한 반응을 했으므로 대응표본 t-검정을 하거나,

두 조건의 차이값이 0과 유의하게 다른지 검증하는 일표본 t-검정을 할 수 있을 것이다.

위의 캡쳐는 r에서 일표본 t-검정을 회귀분석 모형으로 실시한 것이다.

맨 첫 줄은 데이터를 불러오는 것이고,

두 번째 줄은 명망이 낮은 조건의 평균 값을, 세 번째 줄은 명망이 높은 조건의 평균 값을 산출한 것이다.

그 후, 명망이 높은 조건과 낮은 조건의 차이 값을 구한다.

 

이렇게 구한 차이 값은 종속 변인으로 사용된 것을 알 수 있고,

선형모형 분석 결과에 대한 summary를 봤을 때

절편이 0과 유의하게 다르면 높은 명망 점수와 낮은 명망 점수가 다르다고 해석한다.

 

●long format에서 분석

LMEM을 분석하기 위해 필요한 r code는 r에 내장되어 있지 않기 때문에

library 함수를 이용하여 LMEM 분석에 필요한 package를 먼저 불러준다.

그 후 데이터를 불러오고(3째 줄) 해석의 용이를 위해 평균 중심화를 해준 뒤(4째 줄),

모형을 구성한다(빨간 상자).

 

long format 분석에서 눈에 띄게 달라진 점은 (1 + prestigeC|subject.ID)라는 코드가 추가된 것이다.

이것이 바로 나중에 다룰 무선 효과로, 여기서는 참가자에 대한 무선 절편과 무선 기울기가 추가되었다고 생각하시면 된다.

각각이 무엇인지는 나중에 다룰 것이니 지금은 '아 이런 게 있구나' 정도로만 생각하시면 되겠다.

 

●분석 결과 비교

두 가지 데이터 구조에서 분석하는 방법을 살펴보았는데,

위의 예에서 wide format으로 분석하던 long format으로 분석하던 분석 결과는 동일하게 나온다.

 

 

 

그럼 오늘은 여기까지 하고 내일은 기본 용어 중 고정 변수와 무선 변수를 다룰 예정이다.

반응형

+ Recent posts