[Day 33] Choose your ML problems
2022. 3. 10. 21:17ㆍAI/Codestates
728x90
반응형
코딩부트캠프 | 코드스테이츠 - 비전공생도 개발자가 될 수 있습니다
코딩부트캠프를 찾는다면? 개발자로 커리어 전환을 위한 책임있는 코딩 교육 기관! 서비스 기획자, 그로스 마케터, 데이터 사이언티스트 등 다양한 전문 커리어에 도전하세요. 취업 성공의 후기
www.codestates.com
Warm-up
- Classification Accuracy
- Imbalanced Classes
Note
- 타겟설정
- 이산형, 순서형, 범주형 타겟 특성도 회귀문제 또는 다중클래스 분류문제로 볼 수 있음.
- 회귀, 다중클래스 분류문제들도 이진 분류모델로 바꿀 수 있음.
- 정보의 누수 ( Leakage )
- 타겟 변수 외에 예측 시점에 사용할 수 없는 데이터가 포함되어 학습이 이루어 질 경우.
- 훈련데이터와 검증데이터를 완전히 분리하지 못했을 경우.
- 평가지표 선택
- 정확도만 사용하면 판단이 정확하지 않음.
- 정밀도, 재현율, ROC Curve, AUC 등을 같이 사용해줘야 함.
- 불균형 클래스
- OverSampling
- UnderSampling
- Skewd Data
- Log 변환 등으로 치우친 데이터를 가운데로 옮겨줘야함.
Review
더보기
많은 데이터를 찾아보고 그것을 분석해보면서 점점 더 분석해보고 싶은 생각이 든다.
참고
더보기
https://www.youtube.com/watch?v=XeJZbCT84Js
https://laptrinhx.com/confusion-matrix-accuracy-precision-recall-f1-score-2087412546/
Confusion Matrix, Accuracy, Precision, Recall, F1 Score
Binary Classification MetricHow to evaluate the performance of a machine learning model?Let us consider a task to classify whether a person is pregnant or not pregnant. If the...
laptrinhx.com
728x90
반응형
'AI > Codestates' 카테고리의 다른 글
[Day 35] Feature Importances (0) | 2022.03.15 |
---|---|
[Day 34] Data Wrangling (0) | 2022.03.15 |
[Day 32] Sprint Review (0) | 2022.03.08 |
[Day 31] Model Selection (0) | 2022.03.08 |
[Day 30] Evaluation Metrics for Classification (0) | 2022.03.04 |