기계 학습에서 랜덤 포레스트 (random forest) 는 여러 의사 결정 트리가 포함된 분류기이며, 출력 범주는 각 나무가 출력하는 범주의 패턴에 의해 결정됩니다. Leo Breiman 과 Adele Cutler 는 무작위 숲을 추론하는 알고리즘을 개발했다. -응?
"무작위 숲" 은 그들의 상표입니다. 이 용어는 Bell Laboratories 의 Tin Kam Ho 가 1995 에서 제기한 무작위 의사결정 숲에서 나온 것이다. 이 방법은 Breimans 의 "안내 수집" 사상과 Ho 의 "임의 하위 공간 방법" 을 결합하여 의사 결정 트리 세트를 설정합니다.
임의 산림 알고리즘은 다음 알고리즘에 따라 각 나무를 구성합니다.
N 은 교육 사례 (샘플) 의 수를 나타내고 m 은 피쳐 수를 나타냅니다.
결정 트리의 한 노드에 대한 결정 결과를 결정하는 데 사용되는 피쳐 수 M 을 입력합니다. 여기서 M 은 M 보다 훨씬 작아야 합니다.
샘플을 다시 넣는 방식으로 N 개의 교육 사용 사례 (샘플) 에서 N 번, 하나의 교육 세트 (bootstrap sampling) 를 형성하고, 추출되지 않은 사용 사례 (샘플) 로 예측하고, 오류를 평가합니다.
각 노드에 대해 의사 결정 트리의 각 노드에 대한 결정을 결정하는 데 사용되는 m 개의 피쳐를 임의로 선택합니다. 이 M 개의 특징에 근거하여 최적의 분할 방식을 계산하였다.
각 나무는 트리밍하지 않고 완전히 자란다. 이는 일반 나무 분류기를 만든 후에 채택될 수 있다.