통계공부/Stata

[Stata] 기본 명령어(1): help, cd, set more off, sysuse

대학원생A씨 2020. 3. 13. 09:55
반응형

이번 포스팅에서는 Stata의 기본 명령어에 대해 알아보고자 한다. 여기서 말하는 기본 명령어란, Stata 프로그램의 세팅과 관련된 명령어와 데이터(혹은 변수) 조작과 관련한 기초적인 명령어들을 뜻한다. 구체적으로 이번 포스팅에서 소개할 명령어는 help, cd, set more off, sysuse이다.

 


1. help + '명령어'

help + 명령어 : 명령어에 관한 설명을 제공하는 명령어

help는 명령어에 관한 설명을 해주는 명렁어이다. 다시 말해, help + '명령어'를 입력하게 되면  해당 '명령어'에 관한 설명을 제공해준다. 예시로, help help command 창에 입력했다고 하자. 그럼 다음과 같은 화면이 뜬다.

사진과 같이  help 라는 명령어에 대한 설명을 제공하는 창이 뜬다 .

'help' 명령어를 가장 먼저 소개하는 이유는, 이후 소개할 여러 명령어에 대해 command 창에 'help + 명령어'를 입력하여 stata 프로그램에서 제공하는 설명을 더 읽어보면, 해당 명령어를 이해하는데 도움이 될 것이기 때문이다. help와 같은 간단한 명령어도 있지만, 이후 소개되는 명령어들은 다양한 option들을 추가할 수 있는데, 이 때 help를 사용하면 명령어 사용에 도움이 될 것이다.

 

 

2. cd

cd : 현재 작업공간을 확인하는 명령어
cd + ["]
폴더위치["] : 작업공간을 
변경할 때 쓰는 명령어

 

cd change directory의 약자로, 작업공간을 확인 및 변경할 때 쓸 수 있는 명령어이다.

사실 현재의 작업공간은 Stata화면을 켰을 때, 맨 아래 공간에 표시되기 때문에 굳이 cd만을 이용하여 현재 작업공간을 확인하는 경우는 많지 않다.

사진에서와 같이 맨 아래 부분에 작업 공간을 명시하고 있다.

Stata 프로그램만을 이용하여 통계 분석을 할 때는, cd를 굳이 쓸 필요는 없지만 다른 통계 프로그램과 연동하여 분석을 진행하여야 하는 경우(대표적으로 Stata에서 기본적으로 데이터를 정리한 후, mplus로 넘어가 통계 작업을 마저 해야 하는 경우)에는 cd를 써야 한다. 왜냐하면 원본 데이터가 저장된 폴더와 Stata 프로그램에서의 working directory가 일치하지 않는 경우에 오류가 발생하기 때문이다. 개인적으로는 그냥 통계 분석을 시작할 때디폴트처럼 일단 working directory를 원본 데이터가 저장되어 있는 폴더로 바꾸고 시작을 한다

 

cd C:\Data\panel\YP
cd "C:\Data\panel\YP"

이런 식으로 입력을 하면 된다. 위아래 예시는 "가 있고 없고의 차이인데폴더명에 space가 한 칸이라도 들어가있으면 따옴표(")를 반드시 입력해주어야 하며, 없을 경우에는 따옴표(")가 없어도 무방하다. 그런데 그냥 웬만하면 폴더명을 빈 칸(space) 없이 하는 것이 좋으며, 명령어 입력시에 따옴표(")도 그냥 습관처럼 넣어주는 것이 안전하다.

 

cd에 대한 설명이 길어졌는데, 핵심만 말하자면 cd + "원본 데이터가 있는 폴더"로 입력하면 된다.

참고로 원본 데이터가 있는 폴더를 어떻게 입력해야 할 지 모를 수 있는데, 그 방법은 매우 간단하다.

원본 데이터가 있는 폴더를 열고 주소 부분을 클릭하면, stata에서 요구하는 형식의 폴더 주소를 긁어올 수 있다.

[ 왼쪽] 주소 부분을 클릭하면, [오른쪽]과 같이 폴더 주소를 긁어올 수 있다

 

3. set more off

set more off [, permanently] : 결과창에서 뜨는  -more- 메세지를 끌 수 있는 명령어

 

Stata 프로그램을 돌리다보면, 결과창의 크기가 부족하여 -more-이라는 메세지가 뜨는 경우가 있다.

결과창에 분석 결과를 모두 담을 수 없을 경우, 사진과 같이 -more이라는 문구가 뜬다 .

이런 경우에는 결과가 모두 뜰 때까지 -more-를 클릭하거나, 키보드 자판을 눌러주어야 하는 번거로움이 있는데, 이를 해결할 수 있는 명령어가 set more off이다(set more on-more-이라는 메세지가 뜨도록 설정하는 명령어인데, 굳이 필요가 있나 싶다). 그리고 뒤에 옵션으로 ,perm을 붙일 수 있는데 permanently가 영원히라는 뜻이기 때문에 set more off, permanently를 하면 앞으로 stata 프로그램을 종료 후에도 기본적으로 set more off가 기본 세팅으로 인식되어 프로그램을 켤 때마다 set more off를 입력할 필요가 없어진다. 그리고 위에 설명에 perm부분만 밑줄을 쳤는데, 이는 permanently를 다 쓰기 귀찮으니 perm까지만 쳐도 stata 프로그램이 알아서 permanently로 이해하고 명령어를 실행해준다는 것이다. 대신 귀찮아서 perm보다 더 짧게(per, p ) 입력하여 오류 메세지가 뜨니 perm까지 입력해야 한다.

 

 

4. sysuse

sysuse + ["]데이터 파일명["] : Stata 프로그램에 내재된 기본 데이터를 불러오는 명령어

 sysuse Stata 프로그램에 내재된 기본 데이터를 불러오는 명령어이다. 그럼 Stata에 내재된 데이터들에는 무엇이 있는가? 이를 확인하기 위해서는 command창에 sysuse dir를 입력하면 다음과 같은 결과를 얻을 수 있다.

Stata  프로그램에 기본적으로 내재되어 있는 데이터들의 목록

이중에서 원하는 것을 골라 다음과 같이 쓰면 된다

 

sysuse lifeexp
sysuse "lfieexp"

 

아마 통계수업을 들을 때, 실습 예제로 쓸 수 있는 명령어이지만 평소에는 굳이 쓸 일이 없을 것이다.

 

반응형