[Day 37] Sprint Review

2022. 3. 25. 20:59AI/Codestates

728x90
반응형

https://www.codestates.com/

 

코딩부트캠프 | 코드스테이츠 - 비전공생도 개발자가 될 수 있습니다

코딩부트캠프를 찾는다면? 개발자로 커리어 전환을 위한 책임있는 코딩 교육 기관! 서비스 기획자, 그로스 마케터, 데이터 사이언티스트 등 다양한 전문 커리어에 도전하세요. 취업 성공의 후기

www.codestates.com


​Summary

  • 특성 중요도 ( Feature Importances )
    • 피쳐 중요도 ( Tree ) : 노드들의 지니불순도 / Information Gain을 기준으로 계산
      • 장점 : 빠른 속도
      • 단점 : Model-Dependent, High-Cardinality에 치우친 결과
    • Drop-Column 중요도 : 각 특성들을 Drop하고 모델을 Re-Fit을 한후 Evaluate
      • 장점 : 직관적
      • 단점 : 매우 느림
    • 순열 중요도 ( Permutation Importances ) : 각 특성들을 Shuffle하고 모델 Evaluate
      • 장점 : Drop-Column 과 매커니즘을 비슷하면서도 속도가 빠름
      • 단점 : 랜덤성
  • PDP : 모델의 예측값이 특정 피쳐의 변화에 따라 평균적으로 어떻게 변하는지 보여주는 그래프
    • ICE 곡선 : 특정 데이터에 대해 모델의 예측값이 특정 피쳐의 변화에 따라 어떻게 변하는지 보여주는 그래프
    • 해석 시 유의할 점
      • 각 변수들 분포의 독립성 가정
      • 변수의 분포를 함께 고려할 것

  • SHAP : 특정 데이터에 대해 모델의 예측값에 각 피처들이 얼마나 기여했는지를 보여줌

 

728x90
반응형

'AI > Codestates' 카테고리의 다른 글

[Day 44] Section 2 Review  (0) 2022.03.25
[Day38 ~ Day43] Section 2 Project  (0) 2022.03.25
[Day 36] Interpreting ML Model  (0) 2022.03.25
[Day 35] Feature Importances  (0) 2022.03.15
[Day 34] Data Wrangling  (0) 2022.03.15