순수 무작위 샘플링의 구체적인 방법은 다음과 같습니다. ① 추첨. 전체 군체의 모든 단위를 하나씩 서명하고 골고루 섞은 후 추출한다. ② 난수 표법. 전체 셀의 번호를 매긴 다음 난수 테이블의 모든 시작점 (임의의 행 또는 열) 에서 원하는 샘플 양에 도달할 때까지 왼쪽에서 오른쪽 또는 오른쪽에서 왼쪽, 위 또는 아래로 추출합니다.
순수 임의 샘플링에는 전체 모집단의 모든 단위 목록인 전체 샘플 상자가 있어야 합니다. 집단이 너무 크면 이런 샘플 박스를 만드는 작업량이 엄청나고 상황이 많아 그룹 명단을 사용할 수 없게 된다. 따라서 순수 무작위 샘플링은 대규모 사회 조사에 거의 사용되지 않는다. 먼저 하나 이상의 특징에 따라 전체 군체를 여러 개의 하위 군으로 나눕니다. 각 하위 군체를 한 층이라고 합니다. 그런 다음 각 레이어에서 임의로 하위 샘플을 선택합니다. 이 하위 샘플은 합쳐서 총 샘플입니다. 각 층의 샘플 수를 결정하는 세 가지 방법이 있습니다: ① 층별 비율. 즉, 각 레이어의 샘플 수는 해당 레이어의 총 수에 대한 비율과 같습니다. 예를 들어 샘플 양 n=50, 전체 N=500 인 경우 n/N=0. 1 은 샘플 비율이고, 레이어당 샘플 수는 이 비율에 따라 결정됩니다. ② 나이만법. 즉, 각 레이어에서 샘플링할 샘플 수는 해당 레이어의 총 수와 표준 편차의 곱에 비례합니다. ③ 비례 배분 방법. 특정 수준의 병례 수가 총수 중 너무 적을 때 해당 수준의 특징을 샘플에 충분히 반영하려면 해당 수준의 샘플 수를 총 샘플에서 인위적으로 늘릴 수 있습니다. 그러나 이렇게 하면 추론의 복잡성이 증가할 수 있다.
인구를 계층화하는 변수는 계층적 변수이며, 이상적인 계층화 변수는 조사에서 측정할 변수 또는 높이와 관련된 변수입니다. 계층화의 원칙은 계층 내의 동질성과 층간 이질성을 증가시키는 것이다. 일반적인 계층화 변수에는 성별, 나이, 교육 및 직업이 있습니다. 계층 무작위 샘플링은 실제 샘플링 조사에서 널리 사용됩니다. 같은 샘플량에서 단순한 무작위 샘플보다 정확도가 높고 관리가 편리하고 비용이 저렴하며 효과가 더 좋습니다. 등거리 샘플링이라고도 합니다. 이것은 순전히 무작위 샘플링의 변종이다. 시스템이 샘플링할 때 1 ~ n 부터 전체 번호를 매겨 샘플링 거리 K=N/n 을 계산합니다. 여기서 n 은 총 단위 수이고 n 은 샘플 크기입니다. 그런 다음 1 ~ K 에서 난수 k 1 을 샘플의 첫 번째 단위로 추출한 다음 K 1+K, K 1+2k ...
시스템 샘플링은 샘플의 대표성을 낮추므로 주기적인 편차를 방지해야 합니다. 예를 들어 군인 명단은 보통 반별로, 각 반 10 명, 반장행 1 입니다. 샘플링 거리도 65,438+00 이면 샘플은 완전히 군인이나 반장으로 구성됩니다.
간단한 예를 들어: 100 명 중 10 명을 뽑아야 합니다. 이제 각각 1 부터 100 까지 번호를 매겨 1- 10,1/kloc 로 나눕니다 。 。 。 。 。 9 1 끝 100. 10 그룹에서 첫 번째 그룹은 3 번을 뽑는다. (사실 1 부터 10 까지 어떤 번호든 선택할 수 있다.) 그런 다음 두 번째 그룹은 13, 세 번째 그룹은 23, 네 번째 그룹은 33 을 뽑는다. 。 。 10 그룹 추출 93 호. 다중 레벨 샘플링이라고도 합니다. 처음 네 가지 샘플링 방법은 모두 전체적으로 한 번에 직접 샘플링하는 것으로, 단일 단계 샘플링이라고 합니다. 다단계 샘플링은 샘플링 프로세스를 여러 단계로 나누고 위의 두 가지 이상의 방법을 결합하는 것입니다. 예를 들어, 전체 샘플링 방법을 사용하여 베이징의 한 중학교에서 샘플 학교를 추출한 다음, 전체 샘플링 방법을 사용하여 샘플 학교에서 샘플 반을 추출한 다음, 마지막으로 시스템 또는 순수 무작위 샘플링 방법을 사용하여 샘플 클래스에서 샘플 학생을 추출합니다. 전체 연구가 광범위하고 분산되어 있을 때, 종종 다단계 샘플링을 사용하여 조사 비용을 낮춘다. 그러나 각 수준의 샘플에서 오류가 발생하므로 다단계 샘플에서 발생하는 샘플 오류도 그에 따라 증가합니다.