반응형

stata recode 7

논문 따라 패널 데이터 분석하기 - 연구참여자 선정하기: 신나리, 안재진(2014)(3)

지난 포스팅에 이어 신나리, 안재진(2014)의 연구를 따라 한국아동패널의 2~4차년도 자료를 분석할 것이다. 이전 포스팅에서 신나리, 안재진(2014)의 연구에서와 동일한 연구참여자를 선정하였다면, 이번 포스팅에서는 최종연구참여자의 인구사회학적 변수들을 살펴볼 것이다. ☞ 한국아동패널에 관한 설명 해당 연구의 최종 연구참여자는 한국아동패널 2~4차년도 조사에 모두 참여한 가구 중 어머니가 3년 내내 취업을 유지한 집단(392가구)과 계속해서 미취업상태로 남아있는 가구(871가구)다. 이를 위해 이전 포스팅에서 m_work라는 변수를 만들었는데, m_work 변수의 빈도분포를 보면 아래 사진과 같다. 위 결과를 보면 연구참여자 선정이 제대로 이루어진 것으로 보이는데, 여기서 함정이 있다. 바로 tab 명..

통계공부/Stata 2021.06.06

논문 따라 패널 데이터 분석하기: 서미정(2011)(9)

이전 포스팅에 이어 한국아동패널의 1차년도 자료를 활용한 서미정(2011)의 논문을 따라 통계 분석을 진행해보았으며, 참고문헌은 아래와 같다. 서미정(2011). 부모의 심리사회적 특성이 후속 출산계획에 미치는 영향: 유자녀 가구를 중심으로. 육아정책연구, 5(1), 127-148. 분석에서 사용할 변수 기초작업 하기 앞선 포스팅에서 언급하였듯이, 한국아동패널 1차년도 데이터의 무응답 값을 99999999로 코딩하였기 때문에 이를 수정하는 작업이 필요하다. 서미정(2011)에서 사용한 양육방식 변수(EMt08crs001- EMt08crs006)를 sum이라는 명령어를 이용하여 해당 변수의 관찰값, 평균, 표준편차, 최솟값, 최댓값을 살펴보면 최댓값이 아래 사진과 같이 99999999로 코딩되어 있음을 알..

통계공부/Stata 2021.04.10

논문 따라 패널 데이터 분석하기: 서미정(2011)(8)

이전 포스팅에 이어 한국아동패널의 1차년도 자료를 활용한 서미정(2011)의 논문을 따라 통계 분석을 진행해보았으며, 참고문헌은 아래와 같다. 서미정(2011). 부모의 심리사회적 특성이 후속 출산계획에 미치는 영향: 유자녀 가구를 중심으로. 육아정책연구, 5(1), 127-148. 변인들 간 상관관계 분석: 더미 변수로 변환하기 서미정(2011)은 유자녀 가구를 대상으로 후속 출산계획과 관련된 부모의 심리사회적 특성을 규명하기 위해 먼저 연구에 사용된 변인들간 상관관계를 파악하고 로지스틱 회귀분석을 실시하였다. 일반적으로 회귀분석을 진행한 논문에서는 변인들간 상관관계를 표로 나타낸다. 또한 회귀분석 뿐만 아니라 회귀분석을 기반으로 한 여러 통계분석 방법, 예를 들면 구조방정식을 활용한 논문에서도 변인들..

통계공부/Stata 2021.04.01

논문 따라 패널 데이터 분석하기: 서미정(2011)(6)

이전 포스팅에 이어 한국아동패널의 1차년도 자료를 활용한 서미정(2011)의 논문을 따라 통계 분석을 진행해보았으며, 참고문헌은 아래와 같다. 서미정(2011). 부모의 심리사회적 특성이 후속 출산계획에 미치는 영향: 유자녀 가구를 중심으로. 육아정책연구, 5(1), 127-148. 서미정(2011)은 부모의 심리사회적 특성 변인이 후속 출산계획에 미치는 영향력을 검증하기에 앞서 통제변인인 자녀수, 가구소득, 부모학력, 어머니의 연령과 취업 여부에 따라 후속 출산계획에 차이가 있는지를 살펴보았다. 이 중 유의미한 차이를 보인 통제변수가 자녀수와 어머니의 연령으로 이에 대한 교차분석을 따라 실시해보도록 하겠다. 자녀수 및 모 연령에 따른 후속 출산계획(교차분석) 먼저 논문에서의 표를 가져왔다. 후속 출산계..

통계공부/Stata 2021.03.27

논문 따라 패널 데이터 분석하기: 서미정(2011)(3)

이전 포스팅에 이어 한국아동패널의 1차년도 자료를 활용한 서미정(2011)의 논문을 따라 통계 분석을 진행해보았으며, 참고문헌은 아래와 같다. 서미정(2011). 부모의 심리사회적 특성이 후속 출산계획에 미치는 영향: 유자녀 가구를 중심으로. 육아정책연구, 5(1), 127-148. 이전 포스팅에 이어 조사대상자의 인구사회학적 특성을 분석하고자 한다. 2. 이상자녀수 이상자녀수에 대한 빈도분포표를 얻기 위해 사용할 변수는 "모" 이상 자녀 수(EMt08brp004)이다. 먼저 명령어 tab을 이용해 해당 변수의 응답이 어떻게 코딩되어 있는지 살펴보자. 위의 두 사진에서 알 수 있듯이 해당 변수는 무자녀 1, 1명 2, 2명 3, 3명 4, 4명 5, 5명 이상 6, 잘 모르겠음 7로 코딩되어 있다. 앞선..

통계공부/Stata 2021.03.17

논문 따라 패널 데이터 분석하기: 서미정(2011)(2)

이전 포스팅에 이어 한국아동패널의 1차년도 자료를 활용한 서미정(2011)의 논문을 따라 통계 분석을 진행해보았으며, 참고문헌은 아래와 같다. 서미정(2011). 부모의 심리사회적 특성이 후속 출산계획에 미치는 영향: 유자녀 가구를 중심으로. 육아정책연구, 5(1), 127-148. 이전 포스팅에서 최종 표본을 선정하고, 사용할 변수만을 추려놓았다. 이제 표본에 대한 기초 분석 자료를 얻기 위해, 인구사회학적 특성을 분석할 것이다. 서미정(2011)의 조사대상자의 인구학적 및 사회경제적 특성을 살펴보면 변인에는 자녀수, 이상자녀수, 가구소득, 부모 학력, 모 연령, 모 취업/학업이 있다. 하나씩 차근차근 살펴보자. 1. 자녀수 자녀수를 알기 위해 사용할 변수는 "아동" 출생순위(BCh08dmg002)이다..

통계공부/Stata 2021.03.16

[Stata] 기본 명령어(7): replace, recode

이번 포스팅에서는 Stata의 기본 명령어 중 replace, recode에 대해 알아보고자 한다. 여기서 말하는 기본 명령어란, Stata 프로그램의 세팅과 관련된 명령어와 데이터(혹은 변수) 조작과 관련한 기초적인 명령어들을 뜻한다. 그리고 앞선 포스팅에서와 마찬가지로 stata의 lifeexp 데이터를 이용하여 예시를 설명하고자 한다.(Command 창에 sysuse lifeexp라고 쓰면 stata에 내재된lifeexp 데이터를 불러올 수 있다.) 1. replace replace 변수명 = 값 [if] [in] : 해당 변수의 값을 변경할 때 쓰는 명령어 replace는 변숫값을 변경할 때 쓰는 명령어로, 해당 변수를 특정 값으로 바꾼다는 것을 의미한다. 이 때, if 혹은 in 등을 같이 써서..

통계공부/Stata 2020.03.29
반응형