1-1

통계학이란?

- 관심/연구 대상인 모집단의 특성을 파악하기 위해 자료를 수집하고, 

- 그 자료를 정리/요약/분석하여 표본의 특성을 파악한 후,

- 표본의 특성을 이용해 모집단의 특성에 대해 추론하는 것

===> 모집단에서 설문조사/실험/관찰을 통해서 표본을 추출하고, 표본에 대해 통계적 추론으로 표본의 특성으로 그 모집단을 추론하는 것


1-2

1. 확률표본추출 probability sampling

(1) 단순확률추출 SRS, Simple Random Sampling

모집단N에서 표본n을 무작위 추출

(2) 계통추출 Systematic Sampling

- 1~k번째 중 하나를 랜덤하게 선택한 다음, 매 k번째에 해당되는 단위들을 추출

- 선거출구조사 등에 사용

(3) 집락추출 Cluster Sampling

- 서로 인접한 조사단위들을 묶어 집락을 추출하고, 집락 내의 조사단위들을 조사

ex 서울시 고등학교 월평균 사교육비 조사해야할 시, 1단계) 고등학교를 추출하고, 2단계) 학생을 추출한다.

(개인적으로, 집락추출은 크기의 구분이 아닌, 직접 분류화가 필요할 때 사용하는 것인듯?)

(4) 층화추출 Stratified Random Sampling

- 층을 나눈 후, SRS 시행

ex 서울 서점 월매출액 추정해야할 시, 서점을 소/중/대형으로 분류한 후 표본을 추출한다


2. 비확률표본추출 non-probability sampling

- 특정 표본이 선정될 확률을 알 수 없음

- 추론결과의 정확도가 낮음

ex

(1) 편의추출: 자발적 참여, 백화점 앞/포털사이트 인터넷 조사

(2) 유의추출: 전문가 선택

(3) 할당추출: 랜덤화 과정 없이 구성비에 의해 조사대사 선택 


- 목표모집단

- 조사모집단(실제로 조사가능한 범위의 모집단)


1-3

1. 가중치 weight



출처: http://www.kmooc.kr/courses/course-v1:SookmyungK+SM_sta_004k+2018_02SM_02/pdfbook/0/

'분석 > 통계분석' 카테고리의 다른 글

3. 평균/산포  (0) 2019.02.10
2. 자료의 분류  (0) 2019.02.10
RMSE(root-mean-squared error)  (0) 2019.01.30
학습용(Training), 검증용(Validation), 시험용(Test) 데이터 분류  (0) 2019.01.30
시계열 분석  (0) 2019.01.30

+ Recent posts