반응형

통계공부 91

논문 따라 패널 데이터 분석하기 - 연구참여자의 일반적 특성: 신나리, 안재진(2014)(4)

논문 따라 패널 데이터 분석하기 포스팅 시리즈는 국내 패널 데이터를 활용한 논문을 따라 통계분석을 따라해보는 과정을 담았다. 구체적으로 통계 분석 프로그램에는 Stata를 사용했으며, 현재 작성중인 신나리, 안재진(2014)의 연구는 자기회귀 교차지연 모형(autoregressive cross-lagge modeling: ARCL)과 다집단 분석을 활용하였기에 Mplus도 추가적으로 이용할 예정이다. 해당 포스팅을 작성하기 위해 참고한 문헌 출처는 아래와 같다. 신나리, 안재진(2014). 어머니의 취업여부에 따른 양육스트레스와 자기효능감 간의 인과적 종단관계 분석. 아동학회지, 35(5), 135-154. 2021.06.06 - [통계공부/Stata] - 논문 따라 패널 데이터 분석하기 - 연구참여자 ..

통계공부/Stata 2021.06.11

논문 따라 패널 데이터 분석하기 - 연구참여자 선정하기: 신나리, 안재진(2014)(3)

지난 포스팅에 이어 신나리, 안재진(2014)의 연구를 따라 한국아동패널의 2~4차년도 자료를 분석할 것이다. 이전 포스팅에서 신나리, 안재진(2014)의 연구에서와 동일한 연구참여자를 선정하였다면, 이번 포스팅에서는 최종연구참여자의 인구사회학적 변수들을 살펴볼 것이다. ☞ 한국아동패널에 관한 설명 해당 연구의 최종 연구참여자는 한국아동패널 2~4차년도 조사에 모두 참여한 가구 중 어머니가 3년 내내 취업을 유지한 집단(392가구)과 계속해서 미취업상태로 남아있는 가구(871가구)다. 이를 위해 이전 포스팅에서 m_work라는 변수를 만들었는데, m_work 변수의 빈도분포를 보면 아래 사진과 같다. 위 결과를 보면 연구참여자 선정이 제대로 이루어진 것으로 보이는데, 여기서 함정이 있다. 바로 tab 명..

통계공부/Stata 2021.06.06

논문 따라 패널 데이터 분석하기 - 연구참여자 선정하기: 신나리, 안재진(2014)(2)

지난 포스팅에 이어 한국아동패널의 2~4차년도 자료를 활용한 신나리, 안재진(2014)의 연구를 따라 데이터분석을 진행해볼 것이다. 이전 포스팅에서 한국아동패널의 2~4차년도 자료를 병합하기 위한 merge의 기능을 중점적으로 알아보았다면, 이번 포스팅에서는 병합된 자료에서 최종 연구참여자를 추리는 과정을 진행할 것이다. 이와 같이 연구참여자를 선정하는 과정은 keep이나 drop과 같은 기본 명령어만 써도 충분하지만, 연구 조건에 적합한 연구참여자를 골라내기 위해 데이터를 보다 면밀히 살펴볼 필요가 있다. 예를 들어, 한국아동패널에서는 어머니의 취업/학업 상태에 대한 변수가 있는데 나의 연구에서는 학업 중인 어머니를 취업모에 포함시킬 것인지 생각해보고 그 결정을 분석에 반영해야 한다. 보다 자세한 내용..

통계공부/Stata 2021.04.27

논문 따라 패널 데이터 분석하기 - 종단데이터 병합하기: 신나리, 안재진(2014)(1)

'논문 따라 패널 데이터 분석하기' 두번째 시리즈의 포스팅이다. 이번 포스팅은 한국아동패널의 2~4차년도 자료를 활용한 신나리, 안재진(2014)의 연구를 따라 데이터 분석을 해보는 과정을 담았다. 해당 논문은 종단 자료를 사용하였으며, 영아기 자녀를 둔 어머니의 자기효능감 및 양육스트레스의 종단적 인과관계를 알아보기 위해 자기회귀 교차지연 모형(autogressive cross-lagged modeling: ARCL)과 다집단 분석을 실시하였다. 포스팅을 작성하기 위한 참고문헌은 아래와 같다. 신나리, 안재진(2014). 어머니의 취업여부에 따른 양육스트레스와 자기효능감 간의 인과적 종단관계 분석. 아동학회지, 35(5), 135-154. ☞ 원본 논문과 관련된 포스팅 2021.04.21 - [논문 리..

통계공부/Stata 2021.04.26

[Stata] 기본 명령어(9): merge(+append, joinby)

오랜만에 Stata 명령어 설명에 관한 포스팅을 작성하고자 한다. 요즘 신나리, 안재진(2014)의 논문을 따라 패널데이터를 분석해보는 포스팅을 준비하고 있는데, 해당 논문이 종단데이터를 사용하는지라 데이터 간의 병합이 필요하다. 데이터 병합을 위해 Stata에서는 append, merge, joinby라는 명령어를 쓸 수 있는데, 먼저 이들의 차이점을 소개한 뒤 이번 포스팅에서는 merge만을 설명하고자 한다. 1. append, merge, joinby의 차이점 append, merge, joinby 세 명령어는 모두 데이터셋을 병합할 때 사용한다는 점에서 공통점을 보인다. 하지만 이들 세 명령어에는 기능의 차이를 보이는데, 그 차이점에 대해 Stata 측에서는 다음과 같이 설명하고 있다. Appen..

통계공부/Stata 2021.04.22

논문 따라 패널 데이터 분석하기: 서미정(2011)(11)

유자녀 가구를 대상으로 부모의 심리사회적 특성이 후속 출산계획에 미치는 영향을 알아본 서미정(2011)의 연구를 따라 한국아동패널 1차 자료를 분석하고 있다. 이번 포스팅은 해당 포스팅 시리즈의 마지막 편으로, 서미정(2011)에서 가장 중점적으로 알아보고자 했던 후속 출산계획에 대한 로지스틱 회귀분석을 따라해보고자 한다. 서미정(2011)은 후속 출산계획 문답에 '낳겠다'라고 응답한 사람들을 계획집단, '낳지 않겠다'라고 응답한 사람들을 무계획집단, '잘 모르겠다'라고 응답한 사람들은 미결정집단으로 구분지어 해당 집단 분류에 양육방식, 양육스트레스, 자녀기대, 부 양육참여, 모 우울 중 어떠한 요인이 영향을 미치는지 검증하기 위해 로지스틱 회귀분석을 실시하였다. 통제변수로는 자녀수, 가구소득, 부모 학..

통계공부/Stata 2021.04.12

논문 따라 패널 데이터 분석하기: 서미정(2011)(10)

앞선 포스팅에서 연구에서 사용할 변수 중 일부는 더미 변수로, 연속 변수는 기초 작업을 통해 회귀분석의 밑작업을 진행하였다. 이번 포스팅에서는 이러한 밑작업을 바탕으로 변인들간 상관관계를 분석해볼 것이다. 일반적으로 회귀분석을 진행하거나 회귀분석을 바탕으로 한 고급통계들, 예를 들면 구조방정식과 같은 분석을 사용할 때는 변수들간 상관관계를 제시해야 한다. 상관관계란 쉽게 말해 변수간의 연관을 의미하는 것이며, 그 정도를 상관계수로 나타낸다. 상관관계에 대한 이론적 개념이 좀 더 궁금하신 분이라면, 이전 포스팅을 참고하길 바란다. 2021.03.10 - [통계 공부/개념 및 이론] - 홍두승, 설동훈(2012). 사회조사분석 - Ch12. 회귀분석과 경로분석(1) 홍두승, 설동훈(2012). 사회조사분석 ..

통계공부/Stata 2021.04.11

논문 따라 패널 데이터 분석하기: 서미정(2011)(9)

이전 포스팅에 이어 한국아동패널의 1차년도 자료를 활용한 서미정(2011)의 논문을 따라 통계 분석을 진행해보았으며, 참고문헌은 아래와 같다. 서미정(2011). 부모의 심리사회적 특성이 후속 출산계획에 미치는 영향: 유자녀 가구를 중심으로. 육아정책연구, 5(1), 127-148. 분석에서 사용할 변수 기초작업 하기 앞선 포스팅에서 언급하였듯이, 한국아동패널 1차년도 데이터의 무응답 값을 99999999로 코딩하였기 때문에 이를 수정하는 작업이 필요하다. 서미정(2011)에서 사용한 양육방식 변수(EMt08crs001- EMt08crs006)를 sum이라는 명령어를 이용하여 해당 변수의 관찰값, 평균, 표준편차, 최솟값, 최댓값을 살펴보면 최댓값이 아래 사진과 같이 99999999로 코딩되어 있음을 알..

통계공부/Stata 2021.04.10

논문 따라 패널 데이터 분석하기: 서미정(2011)(8)

이전 포스팅에 이어 한국아동패널의 1차년도 자료를 활용한 서미정(2011)의 논문을 따라 통계 분석을 진행해보았으며, 참고문헌은 아래와 같다. 서미정(2011). 부모의 심리사회적 특성이 후속 출산계획에 미치는 영향: 유자녀 가구를 중심으로. 육아정책연구, 5(1), 127-148. 변인들 간 상관관계 분석: 더미 변수로 변환하기 서미정(2011)은 유자녀 가구를 대상으로 후속 출산계획과 관련된 부모의 심리사회적 특성을 규명하기 위해 먼저 연구에 사용된 변인들간 상관관계를 파악하고 로지스틱 회귀분석을 실시하였다. 일반적으로 회귀분석을 진행한 논문에서는 변인들간 상관관계를 표로 나타낸다. 또한 회귀분석 뿐만 아니라 회귀분석을 기반으로 한 여러 통계분석 방법, 예를 들면 구조방정식을 활용한 논문에서도 변인들..

통계공부/Stata 2021.04.01

논문 따라 패널 데이터 분석하기: 서미정(2011)(7)

이전 포스팅에 이어 한국아동패널의 1차년도 자료를 활용한 서미정(2011)의 논문을 따라 통계 분석을 진행해보았으며, 참고문헌은 아래와 같다. 서미정(2011). 부모의 심리사회적 특성이 후속 출산계획에 미치는 영향: 유자녀 가구를 중심으로. 육아정책연구, 5(1), 127-148. 자녀수 및 모 연령에 따른 추가 출산하지 않는 이유(교차분석) 서미정(2011)은 후속 출산계획에 대해 ‘낳지 않겠다’고 응답한 조사대상자들의 추가 출산하지 않는 가장 큰 이유를 자녀수 및 모 연령에 따라 교차분석하였다. 후속 출산 미계획 사유에 대한 한국아동패널의 데이터 변수는 EMt08brp003이다. 먼저 해당 변수의 빈도분포를 보기 위해 tab 명령어를 실행한다. tab EMt08brp003 tab EMt08brp00..

통계공부/Stata 2021.03.29
반응형