통계공부/Mplus

[Mplus] 잠재성장모형(LGM) syntax 설명

대학원생A씨 2020. 4. 9. 09:27
반응형

이번 포스팅에서는 잠재성장모형(Latent Growth Modeling; LGM)의 Mplus syntax를 설명하고자 한다. 잠재성장모형 syntax를 작성하기 위해서는 기본적으로 Mplus syntax 작성에 대한 기본 틀을 이해해야 하므로, 이는 이전 포스팅에서 언급하였다. 이번 포스팅에서 사용할 예시 역시 이전 포스팅들과 마찬가지로 Mplus의 User's Guide 예시를 사용하였다.

 


먼저 잠재성장모형의 syntax를 설명하기 전, 잠재성장모형에 대해 이론적으로 아주 간략히 언급하고 가도록 할 것이다. 잠재성장모형은 구조방정식의 일종으로, 성장궤적을 추적하기 위해 사용되는 분석방법 중 하나이다. 예를 들어, 결혼한 부부를 대상으로 결혼만족도가 시간의 흐름에 따라 어떻게 변화하는지 확인할 수도 있고, 자녀의 연령에 따라 사교육비가 얼마나 증가하는지 등을 확인해볼 수도 있다. 이와 같이 시간의 흐름에 따른 종속변수의 변화궤적을 알고 싶을 때 사용할 수 있는 분석방법이 잠재성장모형으로 최근 논문에 많이 쓰이는 분석 방법 중 하나이다. 좀 더 최근에는 잠재계층 분석과 잠재성장모형이 혼합된 잠재계층 성장모형(Latent Class Growth Modeling; LCGM)도 많이 쓰이고 있다.

 

다시 본론으로 돌아가, 잠재성장모형 분석을 위해서는 가장 먼저 무조건모형(unconditional growth model)을 통해 가장 적절한 형태의 변화궤적을 결정해야 한다. 이 때 무조건 모형이란 아무런 독립변수도 투입하지 않은 모형을 의미하며, 무조건 모형을 통해 어떠한 변화궤적이 가장 적절한지(일차함수, 이차함수, 혹은 삼차함수 등등) 판단을 내린다. 그리고 무조건모형에서 종속변수의 변화궤적에 개인차가 있는지 유의한 검증 결과가 나오면, 이후 독립변수를 투입한 조건모형(conditional growth model)을 통해 종속변수 변화궤적에 영향을 미치는 요인들을 파악해야 한다. 즉, 정리하자면 잠재성장모형 분석을 위해서는 1단계로 아무런 독립변수를 투입하지 않은 상태에서 가장 적합한 변화궤적을 선택한 후, 2단계에서 독립변수를 투입하여 종속변수에 영향을 미치는 독립변수를 파악한다. 그렇다면 이제 Mplus syntax를 알아보도록 하자.

 


TITLE: this is an example of a linear growth model for a continuous outcome
DATA: FILE IS ex6. 1. dat;
VARIABLE: NAMES ARE y11-y14;
MODEL: i s | y11@0 y12@1 y13@2 y14@3;

 

먼저 TITLE 부분부터 보도록 하자. 해당 분석파일은 선형 모형(linear growth model)을 검증하는 파일이자, 종속변수가 연속변수(continuous outcome)임을 알 수 있다. 앞서 언급했듯이 1차적으로 가장 적절한 변화궤적을 선택하기 위해서는 선형 모형(일차함수 모형), 이차함수 모형, 삼차함수 모형 등을 모두 돌려보아야 한다. 여기서는 일차함수 모형을 검증하는 절차로, 사용하는 변수명은 VARIABLE에 제시되어 있듯이, y11부터 y14까지 사용한다.

 

그렇다면 MODEL 부분으로 넘어가보도록 하자. TITLE에서 알 수 있듯이, 해당 분석 파일은 일차함수 모형을 검증하는 과정이기 때문에 MODEL에서 제시된 식 역시 일차함수를 의미하는 syntax가 기입되어 있다. 먼저 MODEL의 대쉬( | ) 앞 부분을 보면, i s라고 되어 있는데 이는 각각 intercept(절편)slope(기울기)를 의미한다. 그리고 뒤의 'y11@0 y12@1 y13@2 y14@3' 부분은 시간 간격을 의미하는데 y11이라는 변수가 0이라는 시점에 측정되었다면, y12는 1이라는 시점에, y13은 2라는 시점에, y14는 3이라는 시점에 측정되었음을 의미한다. 예를 들자면, y11은 2011년도에 측정된 결혼만족도라면 y12는 2012년도에 측정된 결혼만족도값, y13은 2013년도에 측정된 결혼만족도값, y14는 2014년도에 측정된 결혼만족도값을 의미한다. 즉, y11부터 y14까지는 동일한 간격을 두고 측정된 값임을 알 수 있다.

 

아직 이해가 덜 될 수 있으니, 다른 예를 들어보도록 하자.

각각의 변수가 측정된 시기가 위의 표와 같다고 해보자. y11과 y12, 그리고 y12와 y13 간의 간격은 2년 차이가 나지만, y13과 y14의 간격은 3년에 해당한다. 이를 적용하여 MODEL 부분을 수정하면, 앞에 i s는 그대로 두고 뒤의 부분만 다음과 같이 수정하면 된다.

 

MODEL: i s | y11@0 y12@2 y13@4 y14@7;

 

즉, y11을 기준으로 두었기 때문에 @0으로 두고, 이후 y12는 y11과 2년 차이가 나기 때문에 @2, y13은 y11과 4년 차이가 나기 때문에 @4, y14는 y11과 7년 차이가 나기 때문에 @7로 syntax를 수정하면 된다.

 

 

그렇다면 이차함수를 확인하고 싶다면 어떻게 해야 하는가? 이를 위해서는 역시 앞에서와 마찬가지로 MODEL 부분만 다음과 같이 수정을 하면 된다.

 

MODEL: i s q | y11@0 y12@1 y13@2 y14@3;

 

앞에서와 달라진 점을 살펴보면, 바로 대쉬( | ) 앞에 i s가 i s q로 바뀐 것이다. 여기서 i s q는 각각 intercept, slope, quadratic을 의미한다. 즉, 각각은 이차함수 식에서 절편, 일차항의 계수값, 이차항의 계수값에 해당한다고 생각하면 된다. 뒷 부분은 앞에서와 마찬가지로 시간 간격을 의미한다.

 

일반적으로 성장모형에서 접할 수 있는 변화궤적은 일차함수 형태이며, 드물긴 하지만 가끔 이차함수 형태와 piecewise 형태도 있다. piecewise 형태는 쉽게 말해 일차함수에서 한 번 기울기가 꺾이는 지점이 있는 모양이라고 생각하면 된다. Mplus 홈페이지에서는 piecewise 경우도 친절하게 syntax를 제공하고 있다. piecewise 역시 앞에 이차함수와 마찬가지로 MODEL 부분만 수정하여 분석을 진행하면 된다.

 

MODEL: i s1 | y1@0 y2@1 y3@2 y4@2 y5@2;
           i s2 | y1@0 y2@0 y3@0 y4@1 y5@2;

 

위의 과정을 통해 가장 적합한 형태의 무조건 모형을 선택했다면, 이제 독립변수만을 투입해주면 된다. 독립변수 투입을 위해서는 무조건모형에서의 syntax와 모두 똑같이 써주고, MODEL 부분에 한 줄만 더 써주면 된다. 예를 들어, 앞선 무조건 모형에서 1차함수 형태가 가장 적합한 모형이었다고 하면 intercept와 slope만 있을 것이므로, 아래와 같이 syntax를 작성한다(여기서 iv1, iv2, iv3는 독립변수를 의미한다).

 

i s ON iv1 iv2 iv3;

 

만약 2차함수가 가장 적합했다면 quadratic도 추가하여 i s q ON iv1 iv2 iv3;으로 작성하고,

piecewise 형태가 가장 적합했다면 i s1 s2 ON iv1 iv2 iv3;로 작성하면 된다.

반응형