이번 포스팅에서는 데이터가 독립적일 때와 비독립적일 때 에러 항(error term)의 구조가 어떻게 다른지 비교한다.
모든 통계 분석은 아래 그림의 빨간 상자 안처럼 'data = model + error'라는 동일한 기본 구조를 지닌다.
데이터의 독립성과 관계없이 모든 통계 모형은 종속 변인의 평균인 절편(β0)과
하나 이상의 예측 변인(β1X)으로 데이터를 예측한다.
그럼 데이터의 독립성에 따라 차이가 나는 부분은 어디일까?
바로 에러 항의 복잡성이다.
위의 그림을 보면 독립적 데이터는 simple error term으로 표현된 것을,
비독립적 데이터는 complex error term으로 표현된 것을 알 수 있다.
이제 하나씩 보자.
●독립적 데이터(Independent data)
독립적인 자료를 분석하는 경우,
에러 항은 말 그대로 에러 항 하나만을 갖는 매우 단순한 구조를 지닌다.
더 설명할 것이 없으니 바로 비독립적 데이터를 살펴보자.
●비독립적 데이터(Nonindependent data)
반면 데이터가 비독립적이고 LMEM으로 분석될 때는 에러 항이 여러 성분으로 나뉘게 된다.
이는 모형이 부정확한 이유, 즉 에러가 나타날 수 있는 이유가 여러 가지로 설명될 수 있기 때문이다.
연구자가 모형에 설명할 수 있는 구조를 명시한다면 무선 효과가 되는데,
여기에는 무선 절편과 무선 기울기가 있을 수 있다.
무선 절편과 무선 기울기에 관한 이야기는 다음 포스팅에서 좀 더 자세히 다루도록 하고
이번 포스팅의 take away message는 데이터의 독립성에 따라 에러 항의 구조가 달라진다는 것,
데이터가 비독립적일 때 연구자가 이 에러 항의 구조를 잘 구조화하는 것이 무선 효과 구조의 핵심, 즉 LMEM의 핵심이라는 것 정도가 되겠다.
'통계 공부 > Linear Mixed Effects Model' 카테고리의 다른 글
Brauer & Curtin(2018) 논문: 무선 절편과 무선 기울기(2) (0) | 2023.03.28 |
---|---|
Brauer & Curtin(2018) 논문: 무선 절편과 무선 기울기 (0) | 2023.03.27 |
Brauer & Curtin(2018) 논문: 용어 정리 (0) | 2023.03.24 |
Brauer & Curtin(2018) 논문: 데이터 구조(data formats) (0) | 2023.03.23 |
Brauer & Curtin(2018) 논문: 비독립적 데이터 (0) | 2023.03.22 |