통계공부/Stata

[Stata] 기본 명령어(3): list, sort, clear, exit

대학원생A씨 2020. 3. 17. 09:55
반응형

지난 포스팅들에 이어 Stata의 기본 명령어에 대해 알아보고자 한다. 여기서 말하는 기본 명령어란, Stata 프로그램의 세팅과 관련된 명령어와 데이터(혹은 변수) 조작과 관련한 기초적인 명령어들을 뜻한다. 구체적으로 이번 포스팅에서 소개할 명령어는 list, sort, clear, exit이다.

 

 

1. list

list : 변수들의 값을 나열하여 보여주는 명령어
list [
변수명] [if] [in] [,option]

list는 변숫값들을 보여주는 명령어로, 위에서는 간단하게 list만 썼지만 주로 list [변수명] 이런 식으로 입력한다. 아까 위의 예제에서와 같이 Stata에 기본적으로 탑재되어 있는 lifeexp 데이터를 쓴다고 해보자. 이 때, 예를 들어, 내가 popgrowth의 변숫값들을 보고 싶다면, list popgrowth를 입력하면 된다. 그런데 이렇게 명령어를 입력하면 전체 연구대상자들의 모든 변숫값들을 제시하게 되어 다소 불편함을 느낄 수 있다. 예를 들어, 나는 대략적으로 어떤 값들이 있는지만 보고 싶을 경우, 혹은 몇 가지 값만 골라보고 싶을 경우에는 if in이라는 명령어를 추가적으로 쓸 수 있다.

 

먼저 in부터 설명하자면, 연구대상자를 순서대로 1번부터 쭉 번호를 매겼다고 했을 때처음부터 20번까지의 popgrowth라는 변숫값만을 확인하고 싶다고 하자. 그러면 이 때는 list popgrowth in 1/20라고 입력하면 된다

Stata의 lifeexp 데이터를 이용하여 popgrowth 변숫값을 1~20까지 확인한 결과

 

그리고 만약 popgrowth의 변숫값 중 0보다 큰 값만을 골라 보고 싶다고 해보자. 그러면 if라는 조건을 써서list popgrowth if popgrowth>0라고 쓰면 된다. 그러면 popgrowth의 변숫값 중 0 초과인 값들을 모두 보여줄 것이다. 이를 좀 더 응용해보자면, popgrowth의 변숫값 중 0 초과인 값들이 너무 많을 것 같고, 그 중 앞에서 20개만 보고 싶다면 list popgrowth if popgrowth>0 in 1/20이라고 치면 된다.

앞에서 1~20번째 값들 중  popgrowth가 0 초과인 값들을 보여준다 .

 

 

2. count

count [if] [in] : 변숫값 중 if 조건문을 해당하는 값들의 갯수를 세어주는 명령어

앞에서의 예시와 마찬가지로 lifeexp 데이터를 이용해 popgrowth의 변숫값 중 0을 넘는 값들의 갯수를 알고 싶다고 해보자. 이 때 쓸 수 있는 명령어가 countcount if popgrowth>0을 입력해주면 된다. 그 결과는 다음과 같다.

popgrowth의 변숫값 중 0을 초과하는 변수는 총 60개임을 뜻한다. 

 

3. sort

sort + 변수명 : 해당 변수를 오름차순으로 나열하는 명령어

앞에서의 예시와 마찬가지로 lifeexp 데이터를 이용하는데popgrowth의 변숫값을 오름차순으로 정리하고 싶다고 해보자. 이 때, sort popgorwth를 입력하면 popgrowth의 변숫값을 기준으로 데이터가 정리가 된다.

[왼쪽] 원래 데이터, [오른쪽] sort popgrowth를 입력한 후 데이터

 

4. clear & exit

clear: 분석 내용을 종료할 때 쓰는 명령어
exit: 
Stata 프로그램을 종료할 때 쓰는 명령어

 

사실 이 두 가지 명령어는 굳이 쓸 일 없이, 그냥 stata 프로그램을 종료하는 x버튼을 누르는 것이 빠르다. 그래도 두 명령어의 차이를 설명하자면, clear stata 프로그램 자체는 그대로 킨 상태에서 지금까지 했던 분석 내용을 모두 정리할 때 사용하는 명령어인 반면 exit는 프로그램 자체를 종료하는 명령어이다.

반응형