728x90 반응형 outlier1 Isolation Forest : random tree를 사용하는 ensemble-based anomaly detection algorithm.Outlier Detection에 사용되는 대표적인 Unsupervised Learning임.장점:랜덤 분할 기반이라 학습 속도가 빠르고, 고차원 데이터에서도 잘 동작.데이터 분포 가정 불필요.단점이상치 비율을 잘못 지정하면 성능 저하.밀집한 군집 내부의 국소적 이상치(local outlier)는 잘 못 잡을 수 있음.랜덤성에 민감할 수 있어 여러 번 실행 결과가 다를 수 있음.알고리즘 절차원 데이터에서 특징(feature)와 분할값(split value) 을 무작위로 선택해 노드를 분할.반복적으로 분할을 진행하면서 각 샘플을 하나의 leaf node에 고립시킴.위 과정을 여러 개의 랜덤 트리(f.. 2025. 9. 17. 이전 1 다음 728x90 반응형