반응형

통계공부/Stata 42

논문 따라 패널 데이터 분석하기 - 종단데이터 병합하기: 신나리, 안재진(2014)(1)

'논문 따라 패널 데이터 분석하기' 두번째 시리즈의 포스팅이다. 이번 포스팅은 한국아동패널의 2~4차년도 자료를 활용한 신나리, 안재진(2014)의 연구를 따라 데이터 분석을 해보는 과정을 담았다. 해당 논문은 종단 자료를 사용하였으며, 영아기 자녀를 둔 어머니의 자기효능감 및 양육스트레스의 종단적 인과관계를 알아보기 위해 자기회귀 교차지연 모형(autogressive cross-lagged modeling: ARCL)과 다집단 분석을 실시하였다. 포스팅을 작성하기 위한 참고문헌은 아래와 같다. 신나리, 안재진(2014). 어머니의 취업여부에 따른 양육스트레스와 자기효능감 간의 인과적 종단관계 분석. 아동학회지, 35(5), 135-154. ☞ 원본 논문과 관련된 포스팅 2021.04.21 - [논문 리..

통계공부/Stata 2021.04.26

[Stata] 기본 명령어(9): merge(+append, joinby)

오랜만에 Stata 명령어 설명에 관한 포스팅을 작성하고자 한다. 요즘 신나리, 안재진(2014)의 논문을 따라 패널데이터를 분석해보는 포스팅을 준비하고 있는데, 해당 논문이 종단데이터를 사용하는지라 데이터 간의 병합이 필요하다. 데이터 병합을 위해 Stata에서는 append, merge, joinby라는 명령어를 쓸 수 있는데, 먼저 이들의 차이점을 소개한 뒤 이번 포스팅에서는 merge만을 설명하고자 한다. 1. append, merge, joinby의 차이점 append, merge, joinby 세 명령어는 모두 데이터셋을 병합할 때 사용한다는 점에서 공통점을 보인다. 하지만 이들 세 명령어에는 기능의 차이를 보이는데, 그 차이점에 대해 Stata 측에서는 다음과 같이 설명하고 있다. Appen..

통계공부/Stata 2021.04.22

논문 따라 패널 데이터 분석하기: 서미정(2011)(11)

유자녀 가구를 대상으로 부모의 심리사회적 특성이 후속 출산계획에 미치는 영향을 알아본 서미정(2011)의 연구를 따라 한국아동패널 1차 자료를 분석하고 있다. 이번 포스팅은 해당 포스팅 시리즈의 마지막 편으로, 서미정(2011)에서 가장 중점적으로 알아보고자 했던 후속 출산계획에 대한 로지스틱 회귀분석을 따라해보고자 한다. 서미정(2011)은 후속 출산계획 문답에 '낳겠다'라고 응답한 사람들을 계획집단, '낳지 않겠다'라고 응답한 사람들을 무계획집단, '잘 모르겠다'라고 응답한 사람들은 미결정집단으로 구분지어 해당 집단 분류에 양육방식, 양육스트레스, 자녀기대, 부 양육참여, 모 우울 중 어떠한 요인이 영향을 미치는지 검증하기 위해 로지스틱 회귀분석을 실시하였다. 통제변수로는 자녀수, 가구소득, 부모 학..

통계공부/Stata 2021.04.12

논문 따라 패널 데이터 분석하기: 서미정(2011)(10)

앞선 포스팅에서 연구에서 사용할 변수 중 일부는 더미 변수로, 연속 변수는 기초 작업을 통해 회귀분석의 밑작업을 진행하였다. 이번 포스팅에서는 이러한 밑작업을 바탕으로 변인들간 상관관계를 분석해볼 것이다. 일반적으로 회귀분석을 진행하거나 회귀분석을 바탕으로 한 고급통계들, 예를 들면 구조방정식과 같은 분석을 사용할 때는 변수들간 상관관계를 제시해야 한다. 상관관계란 쉽게 말해 변수간의 연관을 의미하는 것이며, 그 정도를 상관계수로 나타낸다. 상관관계에 대한 이론적 개념이 좀 더 궁금하신 분이라면, 이전 포스팅을 참고하길 바란다. 2021.03.10 - [통계 공부/개념 및 이론] - 홍두승, 설동훈(2012). 사회조사분석 - Ch12. 회귀분석과 경로분석(1) 홍두승, 설동훈(2012). 사회조사분석 ..

통계공부/Stata 2021.04.11

논문 따라 패널 데이터 분석하기: 서미정(2011)(9)

이전 포스팅에 이어 한국아동패널의 1차년도 자료를 활용한 서미정(2011)의 논문을 따라 통계 분석을 진행해보았으며, 참고문헌은 아래와 같다. 서미정(2011). 부모의 심리사회적 특성이 후속 출산계획에 미치는 영향: 유자녀 가구를 중심으로. 육아정책연구, 5(1), 127-148. 분석에서 사용할 변수 기초작업 하기 앞선 포스팅에서 언급하였듯이, 한국아동패널 1차년도 데이터의 무응답 값을 99999999로 코딩하였기 때문에 이를 수정하는 작업이 필요하다. 서미정(2011)에서 사용한 양육방식 변수(EMt08crs001- EMt08crs006)를 sum이라는 명령어를 이용하여 해당 변수의 관찰값, 평균, 표준편차, 최솟값, 최댓값을 살펴보면 최댓값이 아래 사진과 같이 99999999로 코딩되어 있음을 알..

통계공부/Stata 2021.04.10

논문 따라 패널 데이터 분석하기: 서미정(2011)(8)

이전 포스팅에 이어 한국아동패널의 1차년도 자료를 활용한 서미정(2011)의 논문을 따라 통계 분석을 진행해보았으며, 참고문헌은 아래와 같다. 서미정(2011). 부모의 심리사회적 특성이 후속 출산계획에 미치는 영향: 유자녀 가구를 중심으로. 육아정책연구, 5(1), 127-148. 변인들 간 상관관계 분석: 더미 변수로 변환하기 서미정(2011)은 유자녀 가구를 대상으로 후속 출산계획과 관련된 부모의 심리사회적 특성을 규명하기 위해 먼저 연구에 사용된 변인들간 상관관계를 파악하고 로지스틱 회귀분석을 실시하였다. 일반적으로 회귀분석을 진행한 논문에서는 변인들간 상관관계를 표로 나타낸다. 또한 회귀분석 뿐만 아니라 회귀분석을 기반으로 한 여러 통계분석 방법, 예를 들면 구조방정식을 활용한 논문에서도 변인들..

통계공부/Stata 2021.04.01

논문 따라 패널 데이터 분석하기: 서미정(2011)(7)

이전 포스팅에 이어 한국아동패널의 1차년도 자료를 활용한 서미정(2011)의 논문을 따라 통계 분석을 진행해보았으며, 참고문헌은 아래와 같다. 서미정(2011). 부모의 심리사회적 특성이 후속 출산계획에 미치는 영향: 유자녀 가구를 중심으로. 육아정책연구, 5(1), 127-148. 자녀수 및 모 연령에 따른 추가 출산하지 않는 이유(교차분석) 서미정(2011)은 후속 출산계획에 대해 ‘낳지 않겠다’고 응답한 조사대상자들의 추가 출산하지 않는 가장 큰 이유를 자녀수 및 모 연령에 따라 교차분석하였다. 후속 출산 미계획 사유에 대한 한국아동패널의 데이터 변수는 EMt08brp003이다. 먼저 해당 변수의 빈도분포를 보기 위해 tab 명령어를 실행한다. tab EMt08brp003 tab EMt08brp00..

통계공부/Stata 2021.03.29

논문 따라 패널 데이터 분석하기: 서미정(2011)(6)

이전 포스팅에 이어 한국아동패널의 1차년도 자료를 활용한 서미정(2011)의 논문을 따라 통계 분석을 진행해보았으며, 참고문헌은 아래와 같다. 서미정(2011). 부모의 심리사회적 특성이 후속 출산계획에 미치는 영향: 유자녀 가구를 중심으로. 육아정책연구, 5(1), 127-148. 서미정(2011)은 부모의 심리사회적 특성 변인이 후속 출산계획에 미치는 영향력을 검증하기에 앞서 통제변인인 자녀수, 가구소득, 부모학력, 어머니의 연령과 취업 여부에 따라 후속 출산계획에 차이가 있는지를 살펴보았다. 이 중 유의미한 차이를 보인 통제변수가 자녀수와 어머니의 연령으로 이에 대한 교차분석을 따라 실시해보도록 하겠다. 자녀수 및 모 연령에 따른 후속 출산계획(교차분석) 먼저 논문에서의 표를 가져왔다. 후속 출산계..

통계공부/Stata 2021.03.27

논문 따라 패널 데이터 분석하기: 서미정(2011)(5)

이전 포스팅에 이어 한국아동패널의 1차년도 자료를 활용한 서미정(2011)의 논문을 따라 통계 분석을 진행해보았으며, 참고문헌은 아래와 같다. 서미정(2011). 부모의 심리사회적 특성이 후속 출산계획에 미치는 영향: 유자녀 가구를 중심으로. 육아정책연구, 5(1), 127-148. 이전 포스팅에 이어 조사대상자의 인구사회학적 특성을 분석하고자 한다. 5. 모 연령 어머니의 연령에 대한 빈도분포를 알기 위해 사용할 변수는 "모" 연령(EMt08dmg006)이다. 기존 변수는 만 연령을 물어 19, 20, ... 45, 46과 같이 연속변수로 구성되어 있다. 하지만 서미정(2011)은 인구사회학적 특성을 나타낸 에서 모 연령의 응답 범주를 19~24세, 25~29세, 30~34세, 35~39세, 40~46..

통계공부/Stata 2021.03.19

논문 따라 패널 데이터 분석하기: 서미정(2011)(4)

이전 포스팅에 이어 한국아동패널의 1차년도 자료를 활용한 서미정(2011)의 논문을 따라 통계 분석을 진행해보았으며, 참고문헌은 아래와 같다. 서미정(2011). 부모의 심리사회적 특성이 후속 출산계획에 미치는 영향: 유자녀 가구를 중심으로. 육아정책연구, 5(1), 127-148. 이전 포스팅에 이어 조사대상자의 인구사회학적 특성을 분석하고자 한다. 3. 가구소득 가구소득에 대한 빈도분포표를 얻기 위해 사용할 변수는 월평균 가구 소득(범주형)(DHu08ses007)이다. 먼저 명령어 tab을 이용해 해당 변수의 응답이 어떻게 코딩되어 있는지 살펴보자. 그런데 서미정(2011)에서는 가구소득의 범주를 100만원 이하, 100만원 초과~300만원 이하, 300만원 초과~500만원 이하, 500만원 초과로 ..

통계공부/Stata 2021.03.18
반응형