먼저, 차이점은
다른 샘플링 방법
1, 단순 무작위 샘플링은 총 N 단위에서 무작위로 N 단위를 샘플로 추출하여 가능한 각 샘플이 추출될 확률을 동일하게 만듭니다. 일반적으로 추첨이나 난수 표법을 사용합니다.
2. 시스템 샘플링은 먼저 전체 모든 단위를 특정 순서로 정렬하고 간단한 무작위 샘플로 첫 번째 샘플 단위 (또는 임의 시작점) 를 추출한 다음 나머지 샘플 단위를 차례로 추출합니다. 등거리 샘플링 및 기계 샘플링이라고도 합니다. 등거리 샘플링은 종종 추정량의 추정 분산을 제공하지 못한다.
3. 계층 샘플링법의 구체적인 절차는 전체 단위를 두 개 이상의 독립된 그룹 (예: 남녀) 으로 나누고 두 개 이상의 그룹에서 간단한 무작위 샘플링을 수행하여 샘플이 서로 독립적이라는 것입니다.
(b) 적용 조건이 다르다
1, 단순 임의 샘플링은 총 수가 적은 샘플에 적용됩니다.
시스템 샘플링은 총 수가 큰 샘플링에 적합합니다.
3. 계층적 샘플링은 전체적으로 몇 가지 차이가 뚜렷한 부분으로 구성된 샘플에 적용됩니다.
둘째, 세 가지 사이의 연결.
1. 시스템 샘플링의 초기 단계에서는 간단한 임의 샘플링을 사용합니다.
2. 계층 샘플은 레벨 내에서 간단한 임의 샘플링 또는 시스템 샘플링을 수행할 수 있습니다.
확장 데이터:
어떤 샘플링 방법을 사용하든, 전반적으로 각 개인이 뽑힐 확률은 같다.
1, 임의 샘플링
무작위 샘플링을 사용하면 데이터 세트의 각 관찰 세트가 샘플링될 확률이 동일합니다. 예를 들어 10% 의 비율로 무작위 샘플링을 하면 각 관찰에는 10% 의 확률이 있습니다.
2. 시스템 샘플링 (등거리 샘플링)
예를 들어 100 개의 관찰이 있는 데이터 세트를 5% 의 비율로 샘플링하면 100/5=20 이고 무작위로 선택한 시작점은 18 입니다
3. 계층 샘플링
먼저 샘플 전체를 여러 수준 (또는 하위 세트) 으로 나눕니다. 각 레벨의 관찰은 동일한 확률이나 다른 확률로 설정할 수 있습니다. 이러한 샘플링 결과는 일반적으로 더 대표적이어서 모형의 맞춤 정확도가 향상됩니다.
참고 자료:
Baidu 백과 사전-간단한 무작위 샘플링
Baidu 백과 사전-등거리 샘플링 (시스템 샘플링)
Baidu 백과 사전-계층 적 샘플링 (계층 적 샘플링 방법)