[Day 33] Choose your ML problems

2022. 3. 10. 21:17AI/Codestates

728x90
반응형

https://www.codestates.com/

 

코딩부트캠프 | 코드스테이츠 - 비전공생도 개발자가 될 수 있습니다

코딩부트캠프를 찾는다면? 개발자로 커리어 전환을 위한 책임있는 코딩 교육 기관! 서비스 기획자, 그로스 마케터, 데이터 사이언티스트 등 다양한 전문 커리어에 도전하세요. 취업 성공의 후기

www.codestates.com


Warm-up

  • Classification Accuracy
  • Imbalanced Classes

Note

  • 타겟설정
    • 이산형, 순서형, 범주형 타겟 특성도 회귀문제 또는 다중클래스 분류문제로 볼 수 있음.
    • 회귀, 다중클래스 분류문제들도 이진 분류모델로 바꿀 수 있음.
  • 정보의 누수 ( Leakage )
    • 타겟 변수 외에 예측 시점에 사용할 수 없는 데이터가 포함되어 학습이 이루어 질 경우.
    • 훈련데이터와 검증데이터를 완전히 분리하지 못했을 경우.
  • 평가지표 선택
    • 정확도만 사용하면 판단이 정확하지 않음.
    • 정밀도, 재현율, ROC Curve, AUC 등을 같이 사용해줘야 함.
  • 불균형 클래스
    • OverSampling
    • UnderSampling
  • Skewd Data
    • Log 변환 등으로 치우친 데이터를 가운데로 옮겨줘야함.

Review

더보기

많은 데이터를 찾아보고 그것을 분석해보면서 점점 더 분석해보고 싶은 생각이 든다.


참고

728x90
반응형

'AI > Codestates' 카테고리의 다른 글

[Day 35] Feature Importances  (0) 2022.03.15
[Day 34] Data Wrangling  (0) 2022.03.15
[Day 32] Sprint Review  (0) 2022.03.08
[Day 31] Model Selection  (0) 2022.03.08
[Day 30] Evaluation Metrics for Classification  (0) 2022.03.04