첫째, 무작위 표본 조사
개념: 불완전한 조사. 조사된 모든 사람들 중에서 무작위로 일부 단위 (샘플 단위 선택은 주관적 및 기타 시스템 요소의 영향을 받지 않고 각 전체 단위가 선택된 기회가 동일함) 를 관찰하여 샘플 데이터를 기준으로 인구의 수량 특성을 추론합니다.
주: 샘플 조사가 임의 샘플링 원칙을 따르지 않으면 샘플에서 전체 특성을 추론할 수 없습니다. 따라서 샘플의 무작위성을 보장하는 방법은 샘플링 조사의 가장 중요한 문제입니다.
조건: 확률론에 기반한 샘플링 추정은 샘플 추정 오차의 크기를 추정할 수 있을 뿐만 아니라 특정 방법으로 제어할 수 있습니다.
무작위 표본 조사의 적용 범위:
1, 전체 조사를 수행할 수 없습니다. 예를 들어, 일부 파괴적인 제품 품질 검사.
2. 업무량이 많고 난이도가 높기 때문에 전면적인 조사는 어렵지만 전체적인 데이터를 얻을 필요가 있다. 예를 들면: 중국의 각 가구 소득 지출에 대한 이해.
인구 조사 데이터를 수정하고 보충하십시오.
장점: 시간과 노력을 절약하고, 비용을 절감하고, 안정적이고 효과적입니다 (오류는 과학적 방법으로 제어할 수 있음).
첫째, 단순 샘플링 (시점)
전제 조건: 총량을 미리 알다.
개념: 가장 기본적인 샘플링 방법입니다. 전체 인구의 원래 상황에 따라 순차적으로 번호를 매긴 후 제한 없이 샘플을 추출한다. 추첨, 터치, 주사위, excel =int(rand()*x+ 1) 등의 무작위 함수. 여기서 x 는 합계를 나타냅니다.
샘플링 오류: 샘플 단위의 차이가 작을수록 추출된 샘플의 대표성이 높을수록 샘플링 오류가 낮아집니다.
단점: 인구가 많거나 무한할 때, 번호 지정 작업은 매우 과중하여, 심지어 진행할 수도 없다.
B, 등거리 샘플링 (시간 단계, 기간)
방법 1 전제 조건: 총량은 미리 파악할 수 있습니다.
방법 2 전제 조건: 전반적인 상황을 미리 이해합니다.
먼저 전체 단위를 정렬합니다.
방법 1: 샘플 조사 내용과 무관한 기호별로 정렬합니다 (예: 인구 소득을 조사할 때 성씨의 획별로 정렬).
방법 2: 샘플 조사 내용과 관련된 플래그에 따라 정렬합니다. 예를 들어, 인구 수입을 조사할 때 소득별로 정렬합니다.
샘플링 오류: 정렬 표시와 조사 내용 간의 관계가 가까울수록 순서가 일치할수록 샘플링 오류가 작아집니다.
금기: 전체 순위가 일정 주기성을 나타낼 때, 특히 주기성 리듬이 샘플링 간격과 일치할 때 시스템 오차가 발생하여 샘플의 대표성에 영향을 줄 수 있습니다.
←←
순차적으로 번호를 매긴 후 첫 번째 샘플 셀을 추출합니다.
방법 1: 지정된 구간 내에서 간단한 샘플링을 통해 첫 번째 샘플 단위를 취합니다. (간격 내 샘플 단위 차이가 작을수록 추출된 샘플의 대표성이 높을수록 샘플 오차가 낮아집니다. ) 을 참조하십시오
방법 2: 규정된 구간 내에서 중간 위치의 샘플 단위 (첫 번째 단락의 중간 수준을 나타내는 가장 대표적인 것으로, 더 대표적인 샘플을 얻을 수 있음) 를 취한다.
←←
그런 다음 첫 번째 샘플 셀부터 시작하여 지정된 간격으로 다른 샘플 셀을 추출합니다.
장점: 간단한 무작위 샘플보다 더 간단하고, 비용을 절감하며, 선택한 샘플이 더 대표적입니다.
C, 샘플링 유형 (시점, 기간)
방법 1 전제 조건: 전체 수량을 미리 파악할 수 있습니다.
방법 2 의 전제 조건: 각 그룹이 총 수에서 차지하는 비율과 각 그룹의 상황을 미리 알고 있습니다.
그룹핑 플래그 선택:
각 그룹 태그는 조사 목적의 한 측면에 대한 반응을 나타내며, 가장 적합한 그룹 표시를 선택해야 그룹 결과가 현상의 본질을 정확하게 반영할 수 있습니다.
복합 그룹화: 두 개 이상의 기호로 그룹화합니다. 장점은 포괄적이고 심층적이며 구체적인 분석에 유리하다는 것이다. 단점은 너무 많은 팀이 업무량을 증가시킬뿐만 아니라 주요 조사 목적을 희석시켰다는 것이다. 따라서 먼저 주요 로고별로 그룹화한 다음 보조 로고로 보완해야 한다.
←←
그룹화 그룹 식별:
같은 플래그에서 군중은 서로 다른 특징에 따라 그룹화해야 하며 (피쳐의 범위가 알려진 경우, 일부는 국가 통계 그룹화 제도를 참조할 수 있는 경우), 그룹 간에 상호 배타적 (모든 전체 단위는 한 그룹에만 적합함), 전체 (모든 전체 단위는 한 그룹 내에 있음), 유사 (그룹 간 비교) 해야 합니다. 예를 들어 농산물은 지형에 따라 산지 구릉 평원으로 나뉘며 인구는 연령별로 1~ 18 (소년), 19~30 (청년), 3 으로 나뉜다
샘플링 오류: 샘플 선택에 대한 그룹화 플래그가 조사 목적에 가까울수록 정성 정량 분석이 세밀해질수록 각 그룹 내의 차이가 작아지고, 선택한 샘플 단위가 대표적일수록 샘플 오류가 작아집니다.
←←
그룹당 샘플 수를 결정합니다.
방법 1: 각 그룹 내의 변이 정도에 따라 변이도가 클수록 샘플 단위 수가 많아지고 변이도가 작을수록 샘플 단위 수가 줄어듭니다. (기간)
방법 2: 총 단위 수에 대한 이 단위 수의 비율에 따라 같은 비율의 샘플 단위 수, 즉 유형 비율 샘플을 추출합니다. (시점)
←←
그룹 단위를 정렬합니다.
방법 1: 샘플 조사 목적과 무관한 기호별로 정렬합니다 (예: 인구 소득을 조사할 때 성씨의 획별로 정렬).
방법 2: 샘플링 조사 목적과 관련된 플래그에 따라 정렬합니다. 예를 들어, 인구 수입을 조사할 때 소득별로 정렬합니다.
샘플링 오류: 정렬 표시와 조사 목적 간의 관계가 가까울수록 순서가 일치할수록 샘플링 오류가 작아집니다.
←←
각 그룹은 순차적으로 번호를 매긴 후 첫 번째 샘플 단위를 취한다.
방법 1: 지정된 구간 내에서 간단한 샘플링을 통해 첫 번째 샘플 단위를 취합니다. (간격 내 샘플 단위 차이가 작을수록 추출된 샘플의 대표성이 높을수록 샘플 오차가 낮아집니다. ) 을 참조하십시오
방법 2: 규정된 구간 내에서 중간 위치의 샘플 단위 (첫 번째 단락의 중간 수준을 나타내는 가장 대표적인 것으로, 더 대표적인 샘플을 얻을 수 있음) 를 취한다.
←←
그런 다음 첫 번째 샘플 셀부터 시작하여 지정된 간격으로 다른 샘플 셀을 추출합니다.
장점: 샘플 단위는 각 범주에서 선택되기 때문에 샘플의 모든 유형이 포함되므로 유형 샘플링을 통해 샘플의 대표성을 크게 높일 수 있습니다.
D, 전체 샘플 그룹 (시점)
전제 조건: 총량을 미리 알다.
개념: 먼저 군중을 동일한 속성과 특징을 가진 여러 그룹으로 나눈 다음 순차적으로 번호를 매겨 무작위로 여러 그룹을 샘플로 추출합니다.
샘플링 오류: 그룹 간 속성 유사성이 높을수록 전체 단위 분포가 균일하고 샘플 대표성이 높을수록 샘플링 오류가 작아집니다.
장점: 총수가 크고 단위가 시간과 공간에 분산되어 있을 때, 이 방법은 인력과 물력을 절약하고 비용을 절감할 수 있다.
단점: 샘플링된 샘플은 종종 균일하지 않고 대표성이 상대적으로 낮습니다. 신중히 쓰다.
B, 무작위 표본 조사
개념: 불완전한 조사. 샘플링은 등확률 원칙이 아니라 사람의 주관적인 판단이나 기타 조건에 근거한다.
무작위 표본 조사의 적용 범위:
1, 경우에 따라 엄격한 무작위 샘플링은 거의 불가능합니다. 예를 들어 응답자의 전체 경계가 불분명하여 샘플 상자를 만들 수 없습니다.
2. 연구의 목적을 달성하기 위해 일부 연구는 필요에 따라 총체적으로 대표적 개인을 표본으로 뽑아야 한다.
3, 무작위 샘플링의 운영 절차가 엄격하여 시행하는 데 시간이 많이 걸린다. 따라서 조사의 목적이 단지 문제를 탐구하고, 연구 단서를 얻고, 가설을 제시하는 것이지, 샘플에서 전체를 추론하는 것이 아니라면 무작위 샘플링을 할 필요가 없다.
장점: 비 무작위 샘플링 작업은 시간과 노력을 절약합니다. 연구자들이 조사인파와 조사대상자에 대해 더 잘 이해한다면 더 정확한 결과를 얻을 수 있다.
단점: 주관적인 결정이기 때문에 샘플이 전체 분포 구조를 재현했는지 여부를 보장할 수 없습니다. 샘플 대표성이 작고 오차가 커서 예측할 수 없습니다. 이런 견본으로 인구를 추론하는 것은 매우 믿을 수 없는 것이다.
바, 전형적인 조사
전체 조사에서는 개별 또는 소수의 대표적 단위를 선택해 조사하고자 한다.
일반적인 선택점 방법: 선택점을 정렬합니다.
Bb, 중점 조사
조사인파 중에서 일부 중점 단위를 선택하여 조사하다. 주요 단위는 인구의 극히 일부에 불과하지만 조사한 수량 표시에서는 큰 비중을 차지하고 있다.
장점: 시간과 노력을 절약하고, 비용을 절감하고, 샘플 대표성이 높기 때문에 일반적으로 믿을 만하다고 추정한다.
Bc, 근처 샘플링
자신의 편리한 형식으로 인파 전체에서 우연히 만난 단위를 표본으로 삼다.
목표 샘플링 및 판단 샘플링
주관적인 판단에 근거하여 대표적인 단위를 견본으로 선택하다.
샘플링 오차: 연구원들이 인구에 대해 더 많이 알수록 샘플링 오차가 작아진다.
예, 눈덩이를 굴려서 샘플링합니다
우리가 전반적인 상황을 이해할 수 없을 때, 사람들 중 몇 단위부터 샘플을 채취하여 추천이나 기타 방식을 통해 점점 더 많은 샘플 단위를 찾을 수 있다.
장점: 소그룹 연구에 적합하다.
Bf, 할당량 샘플링
전제 조건: 총 수량과 각 그룹의 총 수에 대한 비율을 미리 알고 있습니다.
샘플 수를 결정하고, 전체 각 범주의 비율에 따라 샘플에서 각 범주의 비율을 결정하고 (샘플로 전체를 시뮬레이트함), 마지막으로 비례적으로 샘플링합니다.
C, 정기 통계 보고서
개념: 위에서 아래로 통합 보고서를 정리한 다음 위에서 아래로 요약 보고서 자료를 에스컬레이션하는 조사 방법.
장점: 1 데이터의 포괄성 및 연속성 데이터의 단일성과 적시성; 데이터의 출처와 정확성은 믿을 만하다.
단점: 1 데이터는 이익의 영향으로 인해 허위 데이터를 뒤섞습니다. 신고가 너무 많으면 기층 부담이 커지고 혼란까지 초래할 수 있다.
보고 기간이 짧을수록 내용이 간결하고 제출 시간이 빠듯합니다.
보고 기간이 길수록 내용이 상세할수록 제출 시간이 느슨해집니다.
D. 인구 조사
개념: 전문기구가 조직한 일회성 종합 조사.
조사 내용은 특정 시점의 현상 (예: 인구 상황, 고정 자산 재고 등) 일 수 있습니다. ) 또는 특정 기간의 과정 현상 (예: 연간 생산 및 판매).
설문 조사의 주요 목적은 중요한 회사의 전반적인 상황과 몇 가지 중요한 경제 현상을 이해하기 위해 정기 통계 보고서에 적합하지 않거나 적합하지 않은 데이터를 수집하는 것입니다.
장점: 정보가 가장 포괄적이고, 가장 체계적이며, 가장 상세하다.
단점: 많은 인력, 물력, 재력, 시간 (조사 등록 기간은 길지 않지만 복잡하고 세밀한 준비와 방대한 데이터 처리에는 시간이 오래 걸림) 이 소요돼 등록 오류가 발생하기 쉽다.
둘째, 조사 계획
조사 목적:
조사가 어떤 문제를 해결해야 하는지 정확히 파악해서 목적이 있어야 어떤 정보를 수집해야 하는지 알 수 있다.
←←
응답자:
조사나 추론된 인구. 그룹 내의 개체를 조사 단위 (전체 또는 일부) 라고 합니다.
←←
보고 단위:
조사 데이터 제출을 담당하는 단위.
←←
설문 조사 내용:
1 의 내용은 조사 목적을 충족시키는 데 필요하며, 필수이거나 불필요한 내용은 포함되지 않을 수 있습니다.
내용에는 정확한 답을 얻을 수 있는 로고만 포함되어야 한다.
내용의 표현은 정확하고 구체적이어야 하며, 애매모호해서는 안 되며, 보도자에게 일치된 인식을 주어서는 안 된다.
설문 조사법: (약간)
←←
설문 조사:
1, 헤더: 질문서 이름 (중간), 보고 회사명, 주소 및 제휴 관계 (왼쪽 위), 표번호, 표 회사 및 승인 번호 (오른쪽 위) 가 포함됩니다.
2. 표체: 질문서 주체는 표 형식으로 조사내용이 표에 나와 있습니다.
3. 발자국: 조사자 또는 신고자의 이름과 서명, 단위 책임자의 이름과 서명을 포함합니다.
설문지의 형식에는 목록식, 단일식, 특수식이 포함됩니다.
1, 샘플을 연구할 때 목록을 사용합니다.
2. 샘플 단위를 조사할 때 양식을 사용합니다.
3. 서로 다른 측정 플래그에 대해 특별한 양식이 필요합니다.
←←
설문 조사 시간:
조사 데이터가 속한 시간은 기간과 시점으로 나뉜다.
←←
조사 방법
←←
조사 기간:
조사 보고서를 제출하는 시간은 제때에 정보를 얻기 위해서이다.
←←
조사 장소:
샘플 셀이 흐름 상태이거나 다른 위치에 분산되어 있는 경우 및 표시를 명시적으로 지정해야 합니다.
←←
조사 조직 및 구현 계획:
조사 활동을 결정하는 조직, 인력 교육 일정, 파일 준비, 예산, 조사 방법, 데이터 제출 방법, 시험 오류 여부 등이 포함됩니다.
←←
설문 조사 데이터 입력:
데이터를 날조하거나 조작하는 모든 방법은 통계정신과 사상에 위배되는 심각한 실수이며, 잘못된 정보는 입력 시 단호하게 버려야 한다.
셋째, 원시 데이터 (primary data):
개념: 직접 소스에서 얻은 데이터입니다. 관찰, 실험, 설문 조사 등.
넷째, 중고 자료 수집 (중고 자료):
개념: 간접 출처를 통해 얻은 데이터.
각종 간행물, 출판된 컴파일 자료, 온라인 자료 등.
인용할 때는 출처를 밝혀야 한다. 하나는 타인의 노동 성과를 존중하는 것이고, 다른 하나는 그 신뢰성을 증명하는 것이다.