통계공부/Stata

논문 따라 패널 데이터 분석하기: 서미정(2011)(4)

대학원생A씨 2021. 3. 18. 08:50
728x90
반응형

이전 포스팅에 이어 한국아동패널의 1차년도 자료를 활용한 서미정(2011)의 논문을 따라 통계 분석을 진행해보았으며, 참고문헌은 아래와 같다.

 

서미정(2011). 부모의 심리사회적 특성이 후속 출산계획에 미치는 영향: 유자녀 가구를 중심으로. 육아정책연구, 5(1), 127-148.

이전 포스팅에 이어 조사대상자의 인구사회학적 특성을 분석하고자 한다.

 

3. 가구소득

가구소득에 대한 빈도분포표를 얻기 위해 사용할 변수는 월평균 가구 소득(범주형)(DHu08ses007)이다. 먼저 명령어 tab을 이용해 해당 변수의 응답이 어떻게 코딩되어 있는지 살펴보자.

그런데 서미정(2011)에서는 가구소득의 범주를 100만원 이하, 100만원 초과~300만원 이하, 300만원 초과~500만원 이하, 500만원 초과로 제시하고 있기 때문에 이에 맞춰 변수를 리코딩할 것이다.

recode DHu08ses007 (0=1) (1=1) (2=2) (3=2) (4=3) (5=3) (6=4) (7=4) (8=4) (9=4) (10=4) (11=4) (67=4) (99999999=.), gen(ses)

DHu08ses007를 리코딩하여 새로운 변수 ses를 생성하였으며, ses의 빈도분포는 아래 사진과 같다.

이렇게 새로 생성된 변수는 변수값에 대한 label이 지정되어 있지 않기 때문에 변숫값이 무엇을 의미하는지 알 수 있도록 labeling 작업을 해준다. labeling 작업에 대한 자세한 설명은 이전 포스팅에 상세히 기록해두었다.

label define ses 1 "100이하" 2 "100-300" 3 "300-500" 4 "500 이상"
label values ses "ses"

마지막으로 labeling된 ses의 빈도분포를 살펴보자.

 

 

4. 부모학력

부모학력에 대한 빈도분포를 알기 위해 사용할 변수는 "모" 최종학력(EMt08dmg014), "부" 최종학력(FFt08dmg014)이다. 두 변수 모두 기존 응답 범주가 무학(1), 초등학교 졸(2), 중학교 졸(3), 고등학교 졸(4), 전문대 졸(5), 대학교 졸(6), 대학원 석사 졸(7) 대학원 박사 졸(8), 무응답(99999999)으로 구성되어 있다. 하지만 서미정(2011)은 응답 범주를 수정하여 고등학교 이하, 전문대(기능대학), 대학교, 대학원이상으로 나타냈으므로 이에 맞게 변수를 리코딩한다.

recode EMt08dmg014 (1=1) (2=1) (3=1) (4=1) (5=2) (6=3) (7=4) (8=4) (99999999=.), gen(M_edu)
recode FFt08dmg014 (1/4=1) (5=2) (6=3) (7=4) (8=4) (99999999=.), gen(F_edu)

참고로 아래 코드에서 (1/4=1)은 (1=1) (2=1) (3=1) (4=1)와 동일하다.

☞ recode 옵션에 관한 설명 포스팅

 

 

두 변수 모두 동일한 응답 범주를 가지므로 "edu"라는 변수 label을 동일하게 적용할 수 있다. 즉, 고등학교 이하는 1, 전문대는 2, 대학교는 3, 대학원이상은 4로 label을 만든 뒤 두 변수(M_edu, F_edu)에 같이 적용해주면 된다. 이를 명령어로 정리하면 아래와 같다.

label define edu 1 "고등학교이하" 2 "전문대" 3 "대학교" 4 "대학원이상"
label values M_edu F_edu "edu"

 

마지막으로 labeling된 변수 M_edu와 F_edu의 빈도분포를 살펴보자.

 

728x90
반응형