통계공부/Mplus

[Mplus] 잠재성장계층분석(LCGA) syntax 설명

대학원생A씨 2020. 9. 26. 09:15
반응형

이번 포스팅에서는 잠재성장계층분석(Laten Class Growth Analysis; LCGA)에 대해 설명하고자 한다. 앞선 포스팅에서와 마찬가지로 해당 포스팅은 Mplus User’s Guide의 예제를 바탕으로 설명하였으며, 잠재성장계층분석을 이해하기 위해서는 선행적으로 잠재성장모형과 잠재계층분석에 대한 이해가 필요하니 이전 포스팅을 참고하면 되겠다.

 

2020/04/09 - [통계 공부/Mplus] - [Mplus] 잠재성장모형(LGM) syntax 설명

2020/04/20 - [통계 공부/Mplus] - [Mplus] 잠재계층분석(LCA)/잠재프로파일분석(LPA) syntax 설명

 Mplus User's Guide: https://www.statmodel.com/ugexcerpts.shtml


 

잠재성장계층분석의 mplus code를 설명하기 전, 간략하게 잠재성장계층분석의 목적을 설명하고자 한다. 성장모형은 종속변수의 변화를 분석하는데 목적이 있는데, 잠재성장계층분석은 그 변화에 있어 다양한 유형(혹은 계층)이 존재함을 가정하고 그 유형을 밝히는데 목적이 있다. 예를 들어, 청소년의 연령에 따른 우울감의 변화를 알아보고 싶다고 해보자. 어떤 집단은 연령이 증가함에 따라 우울감이 증가할 수도 있는 반면, 어떤 집단은 연령이 증가함에 따라 우울감이 감소할 수도 있고 또 다른 집단은 나이에 상관없이 우울감이 일정 수준을 유지할 수도 있다. 이처럼 우울감의 변화에 있어 2개 이상의 잠재계층이 있을 수 있음을 가정하고, 이를 파악하는 것이 잠재성장계층분석의 목적이기에 잠재성장계층분석 code는 잠재성장모형과 잠재계층분석의 코드를 혼합한 형태로 이해하면 될 것이다.

 


TITLE:      this is an example of a LCGA for a binary outcome
  DATA:       FILE IS ex8.9.dat;
  VARIABLE:   NAMES ARE u1-u4;
              CLASSES = c (2);
              CATEGORICAL = u1-u4;
  ANALYSIS:   TYPE = MIXTURE;
  MODEL:
              %OVERALL%
              i s | u1@0 u2@1 u3@2 u4@3;
  OUTPUT:     TECH1 TECH8;

 

먼저 title부터 보도록 하자. ‘this is an example of a LCGA for a binary outcome’이라 되어있기 떄문에 종속변수는 이항변수임을 알 수 있다. 그 다음 DATA에서는 분석에 사용할 데이터 파일이 ex8.9.dat임을 명시하고 있으며, 그 데이터의 변수가 u1-u4임을 VARIABLE에서 알려주고 있다. 아래 CLASSES = c(2);잠재계층이 2개임을 가정하는 것으로, 즉 종속변수 u1-u4의 변화가 두 개의 양상으로 나뉘어질 것이라고 가정하고 분석을 하는 것이다. 만약 종속변수의 변화 양상이 두 개가 아닌 3, 4, 5개 등으로 설정하고 싶다면 괄호 안의 2라는 숫자를 3, 4, 5 등으로 바꾸면 된다. 그리고 종속변수인 u1-u4가 이항변수이기에 종속변수 u1-u4가 이항변수임을 CATEGORICAL = u1-u4;라는 명령문을 통해 알려주고 있다. 참고로 분석할 데이터에서 이항변수가 있을 경우, 모든 이항변수를 언급해줄 필요는 없고 이항변수 중 종속변수만 명시하면 된다. , 독립변수 중에 이항변수가 있다 하더라도 그 변수를 굳이 CATEGORICAL에 언급할 필요가 없다는 것이다.

 

ANALYSIS에서 TYPE=MIXTURE;로 써주면 되고 혹시 분석을 돌렸을 때 warning 메시지가 뜨면서 starts option을 바꿔보라는 내용이 뜬다면 이 부분에 ‘starts = ‘와 ‘stiterations = ‘의 옵션을 추가하면 문제가 해결될 수 있다. 일반적으로 ‘starts = 500 10;‘ ‘stiterations = 10;’으로 작성하면 웬만해서는 분석이 돌아간다(물론 상황에 따라 해당 옵션을 추가해도 분석에 오류가 뜰 수 있다).

 


이처럼 잠재성장계층분석 code를 살펴보면 잠재성장모형의 Model 부분을 그대로 따오고, 잠재계층분석의 Variable 부분을 그대로 따와 적절히 섞은 형태임을 알 수 있다. 이번 포스팅에서 예제로 설명한 잠재성장계층분석 code는 가장 기본형으로 종속변수가 이항변수가 아닌 연속변수가 될 수도 있고, 해당 예시는 잠재계층 내 분산을 0으로 고정하였지만 이를 풀어줄 수도 있다. 하지만 이를 한 포스팅에서 모두 설명할 수는 없기에 우선 기본 예제를 바탕으로 설명하였으니, 기회가 되면 나중에 보다 자세한 잠재성장계층분석 code에 대해 설명해보고자 한다.

반응형