[혼자 공부하는 머신러닝+딥러닝] 5-3. 트리의 앙상블
·
ML & DL/머신러닝 기초
Intro.이사님🗣️ "가장 성능이 좋은 머신러닝 알고리즘을 찾아보게나!"0. 앙상블 학습정형 데이터를 다루는 데 가장 뛰어난 성과를 내는 알고리즘으로, 여러 개의 모델을 합쳐서 더 좋은 결과를 도출함.주로 결정 트리를 기반으로 만들어져 있음.1. 랜덤 포레스트앙상블 학습의 대표주자로, 랜덤한 결정트리의 '숲'이라고 보면 됨.랜덤포레스트의 기본 원리Ⓐ & Ⓑ로 개별 트리에 무작위성을 부여해서 트리의 성능이 너무 강력해지는 것을 막음 (=과대적합 방지)물론 개별트리의 성능은 떨어짐 but 그걸 여러 개 묶어서 일반화하면 높은 성능이 나오게 됨!⭐Ⓐ 훈련세트에 무작위성 주입랜덤포레스트 속의 각 트리는 우리가 입력한 훈련데이터를 그대로 학습하지 않고, 훈련세트와 같은 크기의 부트스트랩 샘플(=중복을 허용한 ..