통계공부/Stata

[Stata] 기본 명령어(5): encode, decode, label, rename

대학원생A씨 2020. 3. 23. 09:05
반응형

 

이번 포스팅에서는 Stata의 기본 명령어 중 encode/decode, label, rename을 설명하고자 한다. 참고로, 저번 포스팅에서와 마찬가지로 예시를 드는 것이 좋을 것 같아 stata 프로그램의 lifeexp 데이터를 이용하여 설명을 하고자 한다.

 

 

1. encode/decode, gen()

encode + 변수명, gen(새로운 변수명) : 문자변수를 숫자변수로 변환하여 새로운 변수로 저장하는 명령어
decode +
변수명, gen(새로운 변수명) : 숫자변수를 문자변수로 변환하여 새로운 변수로 저장하는 명령어

문자변수를 숫자변수로, 혹은 숫자변수를 문자변수로 변환할 때 사용할 수 있는 명령어이다. 보통은 코딩을 할 때부터 숫자로 코딩해두는 경우가 많기 때문에 개인적으로는 잘 쓰지 않는 명령어이다.  

 

lifeexp 데이터를 이용해 설명해보자면, country라는 변수는 문자변수로 저장되어 있기 때문에 다음과 같은 코드를 입력하면 country라는 문자변수를 country2라는 숫자변수로 변환하여 저장해준다.

 

encode country, gen(country2)

[왼쪽] 원본 데이터의 country 변수로 변숫값이 문자형태로 저장되어 있다. 반면 [오른쪽]은 encode를 통해 숫자변수로 전환한 것으로, browse 창에서는 원래 변수인 country와 마찬가지로 문자형태로 변수가 저장되어 있는 것처럼 보이지만 America 대신 3으로 인식되어 있음을 알 수 있다.

 

  

2. label

label define + 라벨명 숫자 "변숫값설명" : 새로운 라벨을 생성할 때 쓰는 명령어
label values
변수명 라벨명 : : 라벨을 해당 변수에 적용할 때 쓰는 명령어

label은 변수의 label을 조작할 때 쓸 수 있는 명령어이다. 개인적으로 label을 수정할 것이 많은 경우에는 do file command로 작성하여 저장하는 편이지만, 수정할 내용이 많이 않을 때에는 그냥 아이콘을 이용하여 수정하는 편이다.

아이콘 창에서 ⑩번을 누르면 variables manager 창이 뜨는데, 해당 창에서 변수 label을 조작할 수 있다.

Variable Manager 창에서 Variable Label 부분이 있는데, 그 아래에 Manage 버튼을 누르면 Manage Value Labels라는 창이 뜬다. 해당 창에서 지금 변수들의 label을 확인할 수 있으며, Create Label을 누르면 label을 새로 생성할 수 있다.  Create Label이라는 화면에서 변수 라벨을 생성하는 것과 동일한 기능을 가진 명령어가 label define이다. 예를 들어, 내가 성별을 1은 남자, 2는 여자로 저장하는 value label을 만든다고 해보자. 그리고 해당 레이블을 변수 V1에 붙인다고 하면 다음과 같이 코드를 입력하면 된다,

 

label define gender 1"male" 2 "female"
label values V1 gender

 

만약 명령어 대신 Variable Manager 창에서 조작을 하고 싶은 경우에는 아래 사진들을 참고하면 된다.

variable manger 창에서 variable label 부분에 있는 Manage 버튼을 누르면 [두 번째] 사진과 같은 manage value labels 창이 뜬다. +버튼을 누르면 아래 label에 대한 설명을 볼 수 있다. 새로운 라벨을 생성하기 위해서는 create label 버튼을 누르면 [네 번째]사진과 같은 화면이 뜬다.

 

 

3. rename

rename 변수 변수' : 하나의 변수명을 바꿀 때 쓰는 명령어
rename (V1 V2 ... Vn) (V1' V2' ... Vn') : 
여러 개의 변수명을 바꿀 때 쓰는 명령어

rename은 변수명을 바꿀 때 쓰는 명령어로, 한 줄의 command에 한 개 이상의 변수명을 바꿀 수 있다. 기존의 변수명을 앞에 입력하고, 바꿀 변수명을 뒤에 써주어야 한다. 여러 개의 변수 이름을 바꿀 때에는 첫 번째 괄호(V1 V2 ... Vn) 안의 변수 갯수와 두 번째 괄호(V1' V2' ... Vn') 안의 변수 갯수가 동일하도록 명령어를 입력해주어야 한다.

반응형