반응형

통계공부/Stata 42

[Stata] 그래프 작성: 파이 그래프(pie chart) +명령어 codebook 설명

Stata 프로그램으로 막대 그래프(bar chart)를 그리는 방법(☞ 포스팅 링크)에 이어 이번 포스팅에서는 파이 그래프(pie chart) 작성 방법에 대해 알아보고자 한다. 지난 포스팅과 마찬가지로 Stata 프로그램에 내재된 데이터셋을 이용할 것이며, 해당 데이터셋에 대한 설명을 위해 Stata의 기본 명령어 중 하나인 codebook에 대한 설명도 함께 하고자 한다. 먼저 stata 데이터셋 중 유권자에 대한 정보를 담은 'voter' 파일을 명령어 sysuse로 불러올 것이다. sysuse voter ☞ sysuse 명령어에 대한 설명 voter 데이터셋을 불러왔다면 먼저 데이터의 구조와 어떠한 변수들이 있는지 확인하기 위해 명령어 describe를 실행한다. describe를 통해 관찰값과..

통계공부/Stata 2021.08.05

[Stata] 그래프 작성: 막대 그래프(bar chart)

Stata 프로그램의 장점 중 하나는 그래프 편집으로, 논문에 바로 게재할 수 있는 퀄리티의 그래프를 바로 얻을 수 있다는 장점이 있다. 이에 이전 포스팅에서 Stata 프로그램에서의 그래프 작성에 관한 기초 내용을 다루었으며, 이번 포스팅에서는 stata 바 그래프 작성과 관련한 구체적인 명령어를 살펴볼 예정이다. Stata 그래프 작성의 기초가 궁금하신 분들은 이전 포스팅을 참고하길 바란다. ☞ 2021.07.28 - [통계공부/Stata] - [Stata] 그래프 작성의 기초 그래프 작성과 관련한 명령어를 알아보기 위해 stata 프로그램에 기본으로 내장된 데이터를 예시로 들어보자. Stata에는 다양한 데이터를 기본 데이터로 내재하고 있는데, 이 중 오늘은 ‘bpwide’라는 데이터셋을 이용할 것..

통계공부/Stata 2021.08.03

[Stata] 그래프 작성의 기초

Stata 메뉴의 새로운 포스팅 시리즈로 그래프 작성 절차를 다루어 보고자 한다. 통계 분석 프로그램에는 Stata 외에도 SAS, SPSS 등이 있는데 이들 프로그램과 비교하였을 때 Stata의 두드러진 장점 중 하나는 그래프이다. 위의 사진은 Stata 공식 홈페이지에서 가져온 사진으로, Stata 프로그램에서 출력된 그래프를 바로 논문에 게재하여도 문제 없을 만큼의 퀄리티를 보여준다. Stata에서 그래프를 작성하기 위해서는 기존 분석과 마찬가지로 인터페이스를 활용하는 방법도 있고, 명령어를 입력하는 방법도 있다. 또한 Stata 프로그램에는 그래픽 편집기가 있기 때문에, 명령어 혹은 인터페이스로 먼저 초벌 그래프를 만든 후 그래픽 편집기를 이용하여 그래프를 보완할 수 있다. 해당 포스팅 시리즈에서..

통계공부/Stata 2021.07.28

논문 따라 패널 데이터 분석하기 - Stata 파일 Mplus 파일로 변환: 신나리, 안재진(2014)(8)

현재 포스팅은 '논문 따라 패널 데이터 분석하기' 시리즈 2편으로 한국아동패널의 2~4차년도 자료를 활용한 신나리, 안재진(2014)의 연구를 따라 데이터 분석을 해보는 과정을 기술하였다. 해당 논문은 종단 자료를 사용하였으며, 영아기 자녀를 둔 어머니의 자기효능감 및 양육스트레스의 종단적 인과관계를 알아보기 위해 자기회귀 교차지연 모형(autogressive cross-lagged modeling: ARCL)과 다집단 분석을 실시하였다. 원본 논문의 출처는 아래와 같다. 신나리, 안재진(2014). 어머니의 취업여부에 따른 양육스트레스와 자기효능감 간의 인과적 종단관계 분석. 아동학회지, 35(5), 135-154. ☞ 원본 논문과 관련된 포스팅 2021.04.21 - [논문 리뷰] - 신나리, 안재진..

통계공부/Stata 2021.07.08

논문 따라 패널 데이터 분석하기 - 역코딩, 척도 평균, t-test: 신나리, 안재진(2014)(7)

지난 포스팅에 이어 이번 포스팅에서는 신나리, 안재진(2014) 연구의 주요 변수인 양육스트레스와 자기효능감의 기술통계치를 어머니의 취업 여부에 따라 나누어 살펴볼 것이다. 이를 위한 밑작업으로 지난 포스팅에서 항목 묶기를 진행하였는데, 이번 포스팅에서는 먼저 자기효능감을 역코딩하고 양육스트레스와 자기효능감 척도의 평균을 내어 그 통계치가 어머니의 취업 여부에 따라 통계적으로 유의한 차이가 있는지(즉, t-test를 실행) 분석해볼 것이다. 역코딩 신나리, 안재진(2014)에서 연구도구에 대한 설명을 보면 자기효능감 척도를 역코딩하여 점수가 높을수록 높은 자기효능감을 의미하도록 환산하였다. 실제 아동패널에서 사용한 자기효능감 척도(Mainieri, 2006) 문항내용을 살펴보면, '내가 가진 문제들 중 ..

통계공부/Stata 2021.07.05

논문 따라 패널 데이터 분석하기 - 항목묶기, 크론바하 알파 구하기: 신나리, 안재진(2014)(6)

논문 따라 패널 데이터 분석하기 포스팅 시리즈 중 현재 2014년 아동학회지에 실린 신나리, 안재진(2014)의 연구를 살펴보고 있다. 드디어 이번 포스팅부터 주요 결과분석에 들어갈 것이다. 구체적으로 이번 포스팅에서는 해당 연구의 주요 변인인 어머니의 양육스트레스 문항에 대해 항목묶기를 실시하고, 양육스트레스와 자기효능감 척도의 크론바하 알파값을 구해볼 것이다. 항목묶기(item parceling) 어머니의 양육스트레스와 자기효능감의 기술통계치를 다루기에 앞서 신나리, 안재진(2014)의 연구와 같이 항목묶기를 먼저 할 것이다. 왜냐하면 한 요인의 측정변수가 많은 경우 추정해야할 요인계수의 수가 표본 수에 의해 과도해져 실제 참인 연구모형을 기각할 확률이 커지기 때문이다. 이에 신나리, 안재진(2014..

통계공부/Stata 2021.07.02

논문 따라 패널 데이터 분석하기 - 연구참여자의 일반적 특성: 신나리, 안재진(2014)(5)

지난 포스팅에서 신나리, 안재진(2014) 연구에서 연구참여자의 일반적 특성에 대해 알아보았다. 구체적으로 해당 연구는 연구참여자의 일반적 특성으로 어머니의 연령, 자녀 월령, 자녀 성별, 어머니의 결혼지위, 어머니의 최종학력, 자녀 수, 월 가구소득을 기술하였으며, 이 때 미취업모 집단과 취업모 집단을 구분하여 통계치를 제시하였다. 또한 해당 연구는 미취업모와 취업모 집단의 특성을 구분하여 살펴보는데 초점이 맞춰져 있어, 인구학적 특성에 있어 집단 간 차이가 나는지 살펴보기 위해 t 혹은 카이제곱 검정을 실시하였다. 이번 포스팅에서는 이를 검증하는 과정을 다룰 것이다. 위에서 언급한 인구학적 특성 중 명목변수(혹은 서열변수)에 해당하는 것은 자녀 성별, 어머니의 결혼지위, 어머니의 최종학력, 그리고 자..

통계공부/Stata 2021.07.01

논문 따라 패널 데이터 분석하기 - 연구참여자의 일반적 특성: 신나리, 안재진(2014)(4)

논문 따라 패널 데이터 분석하기 포스팅 시리즈는 국내 패널 데이터를 활용한 논문을 따라 통계분석을 따라해보는 과정을 담았다. 구체적으로 통계 분석 프로그램에는 Stata를 사용했으며, 현재 작성중인 신나리, 안재진(2014)의 연구는 자기회귀 교차지연 모형(autoregressive cross-lagge modeling: ARCL)과 다집단 분석을 활용하였기에 Mplus도 추가적으로 이용할 예정이다. 해당 포스팅을 작성하기 위해 참고한 문헌 출처는 아래와 같다. 신나리, 안재진(2014). 어머니의 취업여부에 따른 양육스트레스와 자기효능감 간의 인과적 종단관계 분석. 아동학회지, 35(5), 135-154. 2021.06.06 - [통계공부/Stata] - 논문 따라 패널 데이터 분석하기 - 연구참여자 ..

통계공부/Stata 2021.06.11

논문 따라 패널 데이터 분석하기 - 연구참여자 선정하기: 신나리, 안재진(2014)(3)

지난 포스팅에 이어 신나리, 안재진(2014)의 연구를 따라 한국아동패널의 2~4차년도 자료를 분석할 것이다. 이전 포스팅에서 신나리, 안재진(2014)의 연구에서와 동일한 연구참여자를 선정하였다면, 이번 포스팅에서는 최종연구참여자의 인구사회학적 변수들을 살펴볼 것이다. ☞ 한국아동패널에 관한 설명 해당 연구의 최종 연구참여자는 한국아동패널 2~4차년도 조사에 모두 참여한 가구 중 어머니가 3년 내내 취업을 유지한 집단(392가구)과 계속해서 미취업상태로 남아있는 가구(871가구)다. 이를 위해 이전 포스팅에서 m_work라는 변수를 만들었는데, m_work 변수의 빈도분포를 보면 아래 사진과 같다. 위 결과를 보면 연구참여자 선정이 제대로 이루어진 것으로 보이는데, 여기서 함정이 있다. 바로 tab 명..

통계공부/Stata 2021.06.06

논문 따라 패널 데이터 분석하기 - 연구참여자 선정하기: 신나리, 안재진(2014)(2)

지난 포스팅에 이어 한국아동패널의 2~4차년도 자료를 활용한 신나리, 안재진(2014)의 연구를 따라 데이터분석을 진행해볼 것이다. 이전 포스팅에서 한국아동패널의 2~4차년도 자료를 병합하기 위한 merge의 기능을 중점적으로 알아보았다면, 이번 포스팅에서는 병합된 자료에서 최종 연구참여자를 추리는 과정을 진행할 것이다. 이와 같이 연구참여자를 선정하는 과정은 keep이나 drop과 같은 기본 명령어만 써도 충분하지만, 연구 조건에 적합한 연구참여자를 골라내기 위해 데이터를 보다 면밀히 살펴볼 필요가 있다. 예를 들어, 한국아동패널에서는 어머니의 취업/학업 상태에 대한 변수가 있는데 나의 연구에서는 학업 중인 어머니를 취업모에 포함시킬 것인지 생각해보고 그 결정을 분석에 반영해야 한다. 보다 자세한 내용..

통계공부/Stata 2021.04.27
반응형