통계공부/Mplus

[Mplus] 다층모형(Multilevel Modeling) syntax 설명(1)

대학원생A씨 2021. 2. 12. 09:30
반응형

 

이번 포스팅에서는 다층 모형(Multilevel Modeling) 분석 방법을 다뤄보고자 한다. 다층 모형 분석은 mplus, stata hlm 등의 프로그램을 활용하여 분석이 가능하며, 이 중에서도 특히 HLM 프로그램은 다층 모형 분석에 특화된 통계 프로그램이다. 개인적으로 다층 모형 분석을 자주 하는 편은 아니라 HLM 프로그램에 익숙하지 않지만, 다층 모형 분석을 자주 하는 교육학과 대학원생이라면 HLM 프로그램을 알고 있으면 좋을 것이다.

☞ HLM 프로그램 공식 사이트


다층 모형 분석에 관한 Mplus syntax를 다루기 전 간략하게 다층모형에 대해 이야기하고자 한다. 다층모형은 nested data, 위계적 자료 혹은 다층적 자료를 분석할 때 사용하는 통계적 분석 방법이다. 여기서 말하는 nested data를 그림으로 표현하면 다음과 같다.

 

 

예를 들어, 학교별 학생 성적을 종속변수로 통계분석을 진행한다고 해보자. 이 때 학생의 성적, 즉 종속변수에 영향을 미칠 수 있는 요인에는 학생의 ses 수준, 하루 공부시간과 같은 개인적인 요인도 있지만 학교 교사의 질과 같은 학교 수준의 요인도 존재한다. 그리고 학교 수준의 요인은 A학교에서 a1~an학생에게, B학교에서 b1~bn학생에게, N학교에서 n1~nn학생에게 공통적으로 영향을 미치는 요인이기 때문에 전통적인 통계모형에서 집단간 등분산성의 조건을 위배하게 된다. 따라서 이러한 위계적 자료를 분석할 때에는 다층 모형 분석을 진행해야 한다.

 

다시 nested data에 대한 설명으로 돌아와, 예시에서 a1~an/b1~bn/n1~nn1수준, A학교~N학교는 2수준으로 구성된 다층적 자료로 볼 수 있다. A학교에는 a1~an 학생이, B학교에는 b1~bn 학생이, N학교에는 n1~nn 학생이 내재되어 있다. 그리고 1수준에서 개별 학생들은 ses, 하루 공부시간 같은 1수준의 변수를, 2수준에서 각각의 학교들에게는 교사의 질이라는 변수를 가지고 있다. 이 때, A학교의 교사의 질은 학생 a1~an에게 공통적으로 적용된다.


Nested data의 구조를 자세히 살펴보면, 다층모형의 데이터 구조가 잠재성장모형의 데이터 구조와 동일하다는 것을 알 수 있다. 사실 잠재성장모형은 다층모형의 응용 버전으로 1수준은 시간, 2수준은 개인으로 구성된 데이터이다. 이를 그림으로 표시하면 다음과 같다.

 

앞에서의 데이터 구조와 유사하게 개인이라는 2수준 아래 여러 시점(t1~tn)1수준 데이터가 내재되어 있는 형태이다. 앞서 성장모형에 대한 Mplus syntax는 이전 포스팅에서 다루었으므로, 아래 링크를 통해 확인할 수 있다.

2020/04/09 - [통계 공부/Mplus] - [Mplus] 잠재성장모형(LGM) syntax 설명

 

또한 다층모형은 2수준에서 나아가 3수준의 모형으로도 사용할 수 있다. 앞선 예시에서 1수준에는 개인, 2수준에는 학교로 구성된 2수준의 모형을 제시하였는데, 여기에 지역이라는 3수준을 추가한다면 3수준의 모형도 분석이 가능하다. 이를 그림으로 표시하면 아래와 같다.

 

반응형