[Day 37] Sprint Review
2022. 3. 25. 20:59ㆍAI/Codestates
728x90
반응형
코딩부트캠프 | 코드스테이츠 - 비전공생도 개발자가 될 수 있습니다
코딩부트캠프를 찾는다면? 개발자로 커리어 전환을 위한 책임있는 코딩 교육 기관! 서비스 기획자, 그로스 마케터, 데이터 사이언티스트 등 다양한 전문 커리어에 도전하세요. 취업 성공의 후기
www.codestates.com
Summary
- 특성 중요도 ( Feature Importances )
- 피쳐 중요도 ( Tree ) : 노드들의 지니불순도 / Information Gain을 기준으로 계산
- 장점 : 빠른 속도
- 단점 : Model-Dependent, High-Cardinality에 치우친 결과
- Drop-Column 중요도 : 각 특성들을 Drop하고 모델을 Re-Fit을 한후 Evaluate
- 장점 : 직관적
- 단점 : 매우 느림
- 순열 중요도 ( Permutation Importances ) : 각 특성들을 Shuffle하고 모델 Evaluate
- 장점 : Drop-Column 과 매커니즘을 비슷하면서도 속도가 빠름
- 단점 : 랜덤성
- 피쳐 중요도 ( Tree ) : 노드들의 지니불순도 / Information Gain을 기준으로 계산
- PDP : 모델의 예측값이 특정 피쳐의 변화에 따라 평균적으로 어떻게 변하는지 보여주는 그래프
- ICE 곡선 : 특정 데이터에 대해 모델의 예측값이 특정 피쳐의 변화에 따라 어떻게 변하는지 보여주는 그래프
- 해석 시 유의할 점
- 각 변수들 분포의 독립성 가정
- 변수의 분포를 함께 고려할 것
- SHAP : 특정 데이터에 대해 모델의 예측값에 각 피처들이 얼마나 기여했는지를 보여줌
728x90
반응형
'AI > Codestates' 카테고리의 다른 글
[Day 44] Section 2 Review (0) | 2022.03.25 |
---|---|
[Day38 ~ Day43] Section 2 Project (0) | 2022.03.25 |
[Day 36] Interpreting ML Model (0) | 2022.03.25 |
[Day 35] Feature Importances (0) | 2022.03.15 |
[Day 34] Data Wrangling (0) | 2022.03.15 |