'논문 따라 패널 데이터 분석하기' 시리즈의 첫 포스팅을 작성하게 되었다. 해당 포스팅은 패널 자료를 활용한 논문을 따라 데이터 분석을 해보는 과정을 담았다. 이번 포스팅은 한국아동패널의 1차년도 자료를 활용한 서미정(2011)의 논문을 따라 통계 분석을 진행해보았으며, 참고문헌은 아래와 같다.
서미정(2011). 부모의 심리사회적 특성이 후속 출산계획에 미치는 영향: 유자녀 가구를 중심으로. 육아정책연구, 5(1), 127-148.
해당 논문에 대한 요약정리는 이전 포스팅에 작성해두었으며, 분석 자료로 사용된 한국아동패널에 대한 소개 역시 이전 포스팅을 참고하면 된다.
☞ 이번 포스팅 관련 이전 글들
2021.03.14 - [논문 리뷰] - 서미정(2011). 부모의 심리사회적 특성이 후속 출산계획에 미치는 영향: 유자녀 가구를 중심으로
2020.03.30 - [통계 공부/기타] - 국내 패널조사(4): 한국아동패널(PSKC), 한국아동청소년패널조사(KCYPS)
서미정(2011)은 한국아동패널 1차년도 자료 중 본조사에 응한 2,078가구를 최종 표본으로 선정하였다. 따라서 STATA 프로그램에서 먼저 한국아동패널 1차년도 데이터를 오픈한다. 데이터를 열기 위해서는 프로그램 상단 위의 아이콘을 사용해도 되고, 아니면 명령어를 입력하여도 된다. 개인적으로 데이터 파일 열기와 같은 간단한 기능은 아이콘을 이용하는 것이 편하기에 아이콘을 통해 파일을 열어본다.
논문과 동일한 최종 표본을 선정하기 위해 본조사에 응한 2,078가구를 골라내야 한다. 이를 위해 변수 'BMt08int001([08병원조사] 참여 여부 및 유형)'를 활용할 것이다. 해당 변수는 조사가 진행된 2008년도에 병원조사를 참여했는지에 대해 기록한 변수로, 응답의 범주가 아래 사진과 같이 구성되어 있다.
여기서 내가 탈락시킬 표본들이 바로 저 빨간 네모에 해당하는 '1차 조사 미참여' 72가구이다. 72개의 표본들을 사용하기 위해 drop이라는 명령어를 사용할 것인데, 그 전에 '1차 조사 미참여' 값이 어떤 숫자값으로 코딩되어 있는지 확인해야 한다. 이를 위한 명령어는 다음과 같이 입력한다.
tab BMt08int001, nol
'1차 조사 미참여'라는 label이 숫자 9로 입력이 되어 있으므로 1차 조사에 참여하지 않은 표본을 제거하기 위해서는 변수 BMt08int001의 값이 9로 코딩된 경우를 탈락시키면 된다. 이를 위한 명령어는 아래와 같다.
drop if BMt08int001==9
최종 표본을 만들었으니 이제 연구에서 사용한 변수만을 추려낼 것이다. 분석에서 사용한 변수는 아래와 같다.
변수 | 변수 코드 | |
1 | ID | N_ID |
2 | "모" 후속 출산계획 | EMt08brp001 |
3 | "모" 후속 출산 미계획 사유 | EMt08brp003 |
4 | "모" 이상 자녀 수 | EMt08brp004 |
5 | "모" 양육행동: 사회적 | EMt08crs001- EMt08crs006 |
6 | "모" 양육스트레스 | EMt08prs001- EMt08prs010 |
7 | "모" 자녀의 미래기대 | EMt08cre001- EMt08cre006 |
8 | "모" 남편의 양육 참여 | EMt08ppc001- EMt08ppc004 |
9 | "모" 우울 | EMt08dpr013- EMt08dpr018 |
10 | "모" 연령 | EMt08dmg006 |
11 | "모" 소득활동 여부 | EMt08jcg002 |
12 | "모" 최종학력 | EMt08dmg014 |
13 | "부" 최종학력 | FFt08dmg014 |
14 | "모" 취업/학업 상태 | DMt08jcg003 |
15 | 월 평균 가구 소득 | DHu08ses006, DHu08ses007 |
16 | "아동" 출생순위 | BCh08dmg002 |
위의 표와 같은 변수들만을 선택하여 사용할 것이므로 아래와 같은 명령어를 입력해준다.
keep N_ID EMt08brp001 EMt08brp003 EMt08brp004 EMt08crs001- EMt08crs006 EMt08prs001- EMt08prs010 EMt08cre001- EMt08cre006 EMt08ppc001- EMt08ppc004 EMt08dpr013- EMt08dpr018 EMt08dmg006 EMt08jcg002 EMt08dmg014 FFt08dmg014 DMt08jcg003 DHu08ses006 DHu08ses007 BCh08dmg002
'통계공부 > Stata' 카테고리의 다른 글
논문 따라 패널 데이터 분석하기: 서미정(2011)(3) (0) | 2021.03.17 |
---|---|
논문 따라 패널 데이터 분석하기: 서미정(2011)(2) (0) | 2021.03.16 |
[Stata] 다층모형 분석 관련 명령어(2): mixed (3) | 2021.02.17 |
[Stata] 다층모형 분석 관련 명령어(1): mixed, estat icc (2) | 2021.02.16 |
[Stata] 로지스틱 회귀분석 관련 명령어: logit, mlogit (3) | 2020.10.08 |