통계공부/Stata

논문 따라 패널 데이터 분석하기 - 역코딩, 척도 평균, t-test: 신나리, 안재진(2014)(7)

대학원생A씨 2021. 7. 5. 09:00
반응형

지난 포스팅에 이어 이번 포스팅에서는 신나리, 안재진(2014) 연구의 주요 변수인 양육스트레스와 자기효능감의 기술통계치를 어머니의 취업 여부에 따라 나누어 살펴볼 것이다. 이를 위한 밑작업으로 지난 포스팅에서 항목 묶기를 진행하였는데, 이번 포스팅에서는 먼저 자기효능감을 역코딩하고 양육스트레스와 자기효능감 척도의 평균을 내어 그 통계치가 어머니의 취업 여부에 따라 통계적으로 유의한 차이가 있는지(즉, t-test를 실행) 분석해볼 것이다.

 


역코딩

신나리, 안재진(2014)에서 연구도구에 대한 설명을 보면 자기효능감 척도를 역코딩하여 점수가 높을수록 높은 자기효능감을 의미하도록 환산하였다. 실제 아동패널에서 사용한 자기효능감 척도(Mainieri, 2006) 문항내용을 살펴보면, '내가 가진 문제들 중 몇몇 문제는 도저히 내가 해결할 수 없는 것들이다.', '나는 살면서 때때로 뭔가에 휘둘리는 느낌을 받는다.'와 같이 4문항 모두 부정적인 진술문으로 진술되어 있다. 그리고 리커트 척도에 해당하는 자기효능감 척도는 각 문항에 대해 '전혀 그렇지 않다(1)' ~ '매우 그렇다(5)'로 코딩되어 있어, 점수가 높을수록 부정적인 자기 효능감이 높음을 의미한다. 이러한 경우 신나리, 안재진(2014)과 같이 해당 변수들을 역코딩하여 점수가 높을수록 자기효능감이 높음을 의미하도록 만드는 것이 좋다. 그렇다면 역코딩을 위해 명령어 recode를 써보자.

☞ recode 명령어 설명

 

[Stata] 기본 명령어(7): replace, recode

 이번 포스팅에서는 Stata의 기본 명령어 중 replace, recode에 대해 알아보고자 한다. 여기서 말하는 기본 명령어란, Stata 프로그램의 세팅과 관련된 명령어와 데이터(혹은 변수) 조작과 관련한 기초

graduationplease.tistory.com

recode EMt09sff001- EMt09sff004 EMt10sff001- EMt10sff004 EMt11sff001- EMt11sff004 (1=5) (2=4) (3=3) (4=2) (5=1)

 

양육스트레스와 자기효능감 척도의 평균 내기

이제 본격적인 분석을 위해 연구의 주요 변수인 양육스트레스와 자기효능감 척도의 평균을 낼 것이다. 즉, 여러 개의 문항으로 측정된 양육스트레스와 자기효능감을 하나의 평균값으로 점수 내어 분석에 활용한다는 것을 의미한다. 이를 위해 명령어 egen을 쓸 것이다.

 

egen Mps09=rowmean( EMt09prs001 - EMt09prs010 )
egen Mps10=rowmean( EMt10prs001 - EMt10prs010 )
egen Mps11=rowmean( EMt11prs001 - EMt11prs010 )
egen Msef09=rowmean( EMt09sff001 - EMt09sff004 )
egen Msef10=rowmean( EMt10sff001 - EMt10sff004 )
egen Msef11=rowmean( EMt11sff001 - EMt11sff004 )

 

 

t-test 실행

주요 변수인 양육스트레스와 자기효능감이 어머니의 취업 여부에 따라 유의한 차이를 보이는지 분석하기 위해 t검정을 실시한다. t검정을 실시하기 위해서는 먼저 두 집단 간 등분산성이 성립하는지 알아보기 위해 robvar라는 명령어를 실행하고, 그 후 t검정 실시를 위해 ttest라는 명령어를 이용할 것이다.

☞ t-test 관련 명령어 설명

 

[Stata] t-test 관련 명령어: robvar, ttest

이번 포스팅에서는 t-test를 진행할 수 있는 stata 명령어에 대해 알아보고자 한다. 오늘은 이론적인 배경 없이 바로 명령어 설명에 들어갈 것인데, 꼭 짚고 넘어갈 내용이 있다. 바로 t-test를 할 때

graduationplease.tistory.com

robvar Mps09, by(m_work)
robvar Mps10, by(m_work)
robvar Mps11, by(m_work)

어머니의 양육스트레스 경우 취업모와 미취업모의 등분산성 가정이 모두 충족되었다.

robvar Msef09 , by(m_work)
robvar Msef10 , by(m_work)
robvar Msef11 , by(m_work)

반면 어머니의 자기효능감은 4차년도에 취업모와 미취업모의 등분산성 가정이 충족되지 못하였다. 

 

ttest Mps09, by(m_work)
ttest Mps10, by(m_work)
ttest Mps10, by(m_work)

분석결과 취업모보다 미취업모의 양육스트레스가 3년 내내 더 높은 것으로 나타났다.

ttest Msef09 , by(m_work)
ttest Msef10 , by(m_work)
ttest Msef11 , by(m_work) unequal

분석결과 취업모와 미취업모의 자기효능감은 2, 3차년도에서는 차이가 없는 것으로 나타났으나, 4차년도에서는 취업모의 자기효능감이 미취업모의 자기효능감보다 더 높게 나왔다.

앞선 분석결과에서 4차년도 자기효능감의 등분산성 가정이 충족되지 않아, ttest 옵션으로 unequal을 추가하였다. 분석 결과, 어머니의 취업 여부에 따른 자기효능감 차이가 4차년도에서만 나타났다. 사실 이는 신나리, 안재진(2014)의 결과와 반대되는데, 이는 데이터 분석을 논문에 기재된 설명만을 보고 따라하여 실수가 있을 수도 있고 혹은 분석 프로그램의 차이에 기인한 것일 수도 있다. 이유가 무엇이든간에 해당 포스팅의 주요 초점은 데이터 분석을 위해 Stata 명령어와 친숙해지는 것이기 때문에 이러한 부분에 대해서는 넘어가도록 한다.

반응형