통계공부/Stata

논문 따라 패널 데이터 분석하기: 서미정(2011)(1)

대학원생A씨 2021. 3. 15. 09:35
반응형

'논문 따라 패널 데이터 분석하기' 시리즈의 첫 포스팅을 작성하게 되었다. 해당 포스팅은 패널 자료를 활용한 논문을 따라 데이터 분석을 해보는 과정을 담았다. 이번 포스팅은 한국아동패널의 1차년도 자료를 활용한 서미정(2011)의 논문을 따라 통계 분석을 진행해보았으며, 참고문헌은 아래와 같다.

 

서미정(2011). 부모의 심리사회적 특성이 후속 출산계획에 미치는 영향: 유자녀 가구를 중심으로. 육아정책연구, 5(1), 127-148.

 

해당 논문에 대한 요약정리는 이전 포스팅에 작성해두었으며, 분석 자료로 사용된 한국아동패널에 대한 소개 역시 이전 포스팅을 참고하면 된다.  

☞ 이번 포스팅 관련 이전 글들

2021.03.14 - [논문 리뷰] - 서미정(2011). 부모의 심리사회적 특성이 후속 출산계획에 미치는 영향: 유자녀 가구를 중심으로

2020.03.30 - [통계 공부/기타] - 국내 패널조사(4): 한국아동패널(PSKC), 한국아동청소년패널조사(KCYPS)

 


서미정(2011)은 한국아동패널 1차년도 자료 중 본조사에 응한 2,078가구를 최종 표본으로 선정하였다. 따라서 STATA 프로그램에서 먼저 한국아동패널 1차년도 데이터를 오픈한다. 데이터를 열기 위해서는 프로그램 상단 위의 아이콘을 사용해도 되고, 아니면 명령어를 입력하여도 된다. 개인적으로 데이터 파일 열기와 같은 간단한 기능은 아이콘을 이용하는 것이 편하기에 아이콘을 통해 파일을 열어본다.

STATA 프로그램에서 빨간 네모 속 아이콘을 통해 쉽게 파일을 오픈할 수 있다.

논문과 동일한 최종 표본을 선정하기 위해 본조사에 응한 2,078가구를 골라내야 한다. 이를 위해 변수 'BMt08int001([08병원조사] 참여 여부 및 유형)'를 활용할 것이다. 해당 변수는 조사가 진행된 2008년도에 병원조사를 참여했는지에 대해 기록한 변수로, 응답의 범주가 아래 사진과 같이 구성되어 있다.

여기서 내가 탈락시킬 표본들이 바로 저 빨간 네모에 해당하는 '1차 조사 미참여' 72가구이다. 72개의 표본들을 사용하기 위해 drop이라는 명령어를 사용할 것인데, 그 전에 '1차 조사 미참여' 값이 어떤 숫자값으로 코딩되어 있는지 확인해야 한다. 이를 위한 명령어는 다음과 같이 입력한다.

 

tab BMt08int001, nol   

참고: tab 명령어 설명 포스팅 

 

tab 명령어에 nol을 붙이면 변수의 label 값을 숫자로 확인할 수 있다.

'1차 조사 미참여'라는 label이 숫자 9로 입력이 되어 있으므로 1차 조사에 참여하지 않은 표본을 제거하기 위해서는 변수 BMt08int001의 값이 9로 코딩된 경우를 탈락시키면 된다. 이를 위한 명령어는 아래와 같다.

 

drop if  BMt08int001==9

참고: drop 명령어 설명 포스팅 

 

위의 명령어를 입력하면 사진과 같이 72개의 표본이 제거된 것을 확인할 수 있다.

 

최종 표본을 만들었으니 이제 연구에서 사용한 변수만을 추려낼 것이다. 분석에서 사용한 변수는 아래와 같다.

  변수 변수 코드
1 ID N_ID
2 "모" 후속 출산계획 EMt08brp001
3 "모" 후속 출산 미계획 사유 EMt08brp003 
4 "모" 이상 자녀 수 EMt08brp004
5 "모" 양육행동: 사회적 EMt08crs001- EMt08crs006
6 "모" 양육스트레스 EMt08prs001- EMt08prs010
7 "모" 자녀의 미래기대 EMt08cre001- EMt08cre006
8 "모" 남편의 양육 참여 EMt08ppc001- EMt08ppc004
9 "모" 우울 EMt08dpr013- EMt08dpr018
10 "모" 연령 EMt08dmg006 
11 "모" 소득활동 여부 EMt08jcg002 
12 "모" 최종학력 EMt08dmg014 
13 "부" 최종학력 FFt08dmg014
14 "모" 취업/학업 상태 DMt08jcg003 
15 월 평균 가구 소득 DHu08ses006, DHu08ses007
16 "아동" 출생순위  BCh08dmg002

위의 표와 같은 변수들만을 선택하여 사용할 것이므로 아래와 같은 명령어를 입력해준다.

keep N_ID EMt08brp001 EMt08brp003 EMt08brp004 EMt08crs001- EMt08crs006 EMt08prs001- EMt08prs010 EMt08cre001- EMt08cre006 EMt08ppc001- EMt08ppc004 EMt08dpr013- EMt08dpr018 EMt08dmg006 EMt08jcg002 EMt08dmg014 FFt08dmg014 DMt08jcg003 DHu08ses006 DHu08ses007 BCh08dmg002

참고: keep 명령어 설명 포스팅 

반응형