통계공부/Stata

논문 따라 패널 데이터 분석하기: 서미정(2011)(5)

대학원생A씨 2021. 3. 19. 09:20
728x90
반응형

이전 포스팅에 이어 한국아동패널의 1차년도 자료를 활용한 서미정(2011)의 논문을 따라 통계 분석을 진행해보았으며, 참고문헌은 아래와 같다.

 

서미정(2011). 부모의 심리사회적 특성이 후속 출산계획에 미치는 영향: 유자녀 가구를 중심으로. 육아정책연구, 5(1), 127-148.

이전 포스팅에 이어 조사대상자의 인구사회학적 특성을 분석하고자 한다. 

 

5. 모 연령

어머니의 연령에 대한 빈도분포를 알기 위해 사용할 변수는 "모" 연령(EMt08dmg006)이다. 기존 변수는 만 연령을 물어 19, 20, ... 45, 46과 같이 연속변수로 구성되어 있다. 하지만 서미정(2011)은 인구사회학적 특성을 나타낸 <표 1>에서 모 연령의 응답 범주를 19~24세, 25~29세, 30~34세, 35~39세, 40~46세로 수정하여 나타냈으므로 이와 동일한 응답 범주를 가지는 새로운 변수 M_age를 만들 것이다. 이를 위해 먼저 M_age라는 새로운 변수를 생성하고(ⓐ), EMt08dmg006의 변숫값을 기준으로 조건문을 걸어 M_age의 변숫값을 수정해나갈 것이다(ⓑ). 

 

ⓐ : gen M_age=.
ⓑ : replace M_age=1 if (EMt08dmg006>=19 & EMt08dmg006<=24)
replace M_age=2 if (EMt08dmg006>=25 & EMt08dmg006<=29)
replace M_age=3 if (EMt08dmg006>=30 & EMt08dmg006<=34)
replace M_age=4 if (EMt08dmg006>=35 & EMt08dmg006<=39)
replace M_age=5 if (EMt08dmg006>=40 & EMt08dmg006<=46)

☞ gen에 관한 설명 포스팅

☞ replace에 관한 설명 포스팅

 

M_age에 대한 label을 지정하기 위해 아래와 같은 코드를 입력한 뒤, 빈도분포를 제시하면 사진과 같은 결과가 나온다.

label define M_age 1 "19~24세" 2 "25~29세" 3 "30~34세" 4 "35~39세" 5"40~46세"
label values M_age "M_age"

 

 

6. 모 취업/학업

어머니의 취업 및 학업 여부에 관한 빈도분포표는 변수 "모" 취업/학업 상태(DMt08jcg003)을 통해 알 수 있다. 기존 변수와 논문에서 제시한 응답 범주가 동일하기 때문에, tab 명령어를 통해 빈도분포를 확인하고 넘어가면 된다.

어머니의 취업 및 학업 여부 빈도분포


지금까지 서미정(2011)의 논문을 보고 한국아동패널 1차년도 자료를 사용하여 패널 데이터 분석을 진행하였다. 해당 포스팅 시리즈 1편에서는 최종 표본과 사용할 변수를 선정하여 분석 데이터셋을 만들고, 2편~5편에서는 <표 1> 조사대상자의 인구학적 및 사회경제적 특성과 같은 결과를 얻기 위한 과정을 설명하였다. 이후 포스팅에서는 ①자녀수와 어머니의 연령에 따른 후속 출산계획의 응답 빈도 분석, ②자녀수 및 어머니의 연령에 따른 추가 출산하지 않는 이유 분석, ③변인간 상관관계 분석, ④후속 출산계획에 대한 로지스틱 회귀분석을 진행할 것이다.

728x90
반응형