통계공부/개념 및 이론

홍두승, 설동훈(2012). 사회조사분석 - Ch9. 추리통계(1)

대학원생A씨 2021. 3. 7. 09:35
728x90
반응형

해당 포스팅은 홍두승과 설동훈이 집필한 「사회조사분석」의 내용을 정리한 것으로 모든 출처는 아래와 같다.

 

홍두승, 설동훈(2012). 「사회조사분석」. 서울: 다산출판사

Ch9. 추리통계

  • 추리통계(inferential statistics): 모집단을 대표하는 표본자료들을 분석하여 표본의 특성을 파악하고, 그것을 토대로 모집단의 성격을 추리하는 것과 관련된 통계 지식
  • 추리(inference): 표본의 결과를 기초로 모집단의 속성에 대한 결론을 내리거나 일반화를 하는 것
  • 하지만 표본자료는 표집오차(sampling error)를 포함하고 있기 때문에 표본 통계치가 모수와 일치하지 않는 사례가 종종 발생함
  • 따라서 통계적 유의도 검정(statistical significance test)을 통해 가설적 관계가 실제로 발생할 수 있는 확률을 진술함
  • 이 때, 표본자료가 무작위표집을 통해 수집되어 모집단을 잘 대표한다면, 확률의 원리와 신뢰구간을 이용하여 그 표본이 추출된 모집단에 대한 추리가 가능

 

확률: 어떤 특정한 사상이 발생할 가능성을 수치로 나타낸 것

 큰 수의 법칙(law of large number): 어떤 사상이 발생할 가능성을 검증하는 실험이 무한히 반복되면 상대도수로 얻어지는 어떤 사상의 확률은 이론적 확률에 근접한다.

 

확률분포

 확률분포(probability distribution): 어떤 사상이 발생할 가능성의 분포

확률변수(random variable): 각 값을 가질 확률이 규정되어 있는 변수

   - 이산확률변수: 셀 수 있는 값을 가지는 확률변수

   - 연속확률변수: 가능한 값이 실수의 어느 특정 구간 전체에 해당하는 확률변수로 일정한 범위 내의 모든 실숫값을 연속적으로 취함

   - 예를 들어, '동전을 세 개 던져서 나오는 앞면의 수'는 0, 1, 2, 3의 값을 갖는 이산확률변수인 반면 '어느 초등학교 재학생의 키'는 연속확률변수에 해당한다.

 확률변수의 값에 대응하는 확률을 함수로 표현한 것을 확률밀도함수(probability density function)라고 함

 이산형 확률분포(discrete probability distribution)

   - 어떤 이산확률변수가 가질 수 있는 모든 가능한 값들과 그들에 대응하는 확률의 리스트

   - 이산형 확률분포의 종류: 이항분포, 포아송 분포, 초기하분포, 기하분포, 음이항분포

 연속형 확률분포(continuous probability distribution)

   - 특정 변수의 변숫값 사이에 단절이 없는 분포

   - 연속형 확률분포의 종류: 균등분포, 지수분포, 와이블 분포, 감마분포, 베타분포, ②정규분포, ③표준정규분포, 로그정규분포, 카이제곱분포, t-분포, F-분포 등이 있음

 

* 정규분포(normal distribution)
 도수분포곡선이 평균값을 중앙으로 하여 좌우대칭인 종 모양을 이루는 확률분포로 가우스 분포(Gaussian density)라고도 불림
정규분포의 특성
   - 정규분포 곡선 아래의 전체 면적은 1
   - 곡선은 평균에 대해 대칭
   - 양 끝은 0에 무한히 접근
   - 종 모양의 좌우대칭 그래프로서 평균과 표준편차에 의해 분포가 완전히 결정됨
   - 이항분포에서 n이 커지면 p에 상관없이 정규분포에 근사
* 표준정규분포(standard normal distribution)
정규분포를 따르는 확률변수 X를 표준화하한 확률변수 Z의 분포로서 평균이 0이고 분산이 1인 확률분포
* t-분포(Student’s t-distribution)
표준정규분포와 동일하게 종 모양의 분포를 이루고 있으며, t=0에 대해 좌우 대칭인 분포
t-분포는 꼬리부분이 표준정규분포보다 약간 두텁고, 자유도가 증가함에 따라 t-분포는 표준정규분포와 유사한 모양을 띤다.
t-분포는 표본의 크기 n이 작을 때(n<30) 주로 사용하며 모집단 평균, 모집단 평균의 차이 또는 회귀계수의 추정이나 검정에 쓰인다.

 

728x90
반응형
1 2 3 4 5 6 7 8 9 ··· 13