전체 글(307)
-
[Day38 ~ Day43] Section 2 Project
https://github.com/JooJaeHwan/Codestates-Project/tree/main/Section_2 GitHub - JooJaeHwan/Codestates-Project Contribute to JooJaeHwan/Codestates-Project development by creating an account on GitHub. github.com 타자 데이터 크롤링 from selenium import webdriver import pandas as pd from webdriver_manager.chrome import ChromeDriverManager from bs4 import BeautifulSoup import numpy as np import re # 크롤링 drive..
2022.03.25 -
[Day 37] Sprint Review
https://www.codestates.com/ 코딩부트캠프 | 코드스테이츠 - 비전공생도 개발자가 될 수 있습니다 코딩부트캠프를 찾는다면? 개발자로 커리어 전환을 위한 책임있는 코딩 교육 기관! 서비스 기획자, 그로스 마케터, 데이터 사이언티스트 등 다양한 전문 커리어에 도전하세요. 취업 성공의 후기 www.codestates.com Summary 특성 중요도 ( Feature Importances ) 피쳐 중요도 ( Tree ) : 노드들의 지니불순도 / Information Gain을 기준으로 계산 장점 : 빠른 속도 단점 : Model-Dependent, High-Cardinality에 치우친 결과 Drop-Column 중요도 : 각 특성들을 Drop하고 모델을 Re-Fit을 한후 Evalua..
2022.03.25 -
[Day 36] Interpreting ML Model
https://www.codestates.com/ 코딩부트캠프 | 코드스테이츠 - 비전공생도 개발자가 될 수 있습니다 코딩부트캠프를 찾는다면? 개발자로 커리어 전환을 위한 책임있는 코딩 교육 기관! 서비스 기획자, 그로스 마케터, 데이터 사이언티스트 등 다양한 전문 커리어에 도전하세요. 취업 성공의 후기 www.codestates.com Warm-up PDP ( Partial Dependence Plot ) Note 부분 의존도 그림 ( Partical Dependence Plots, PDP ) import sklearn import xgboost import shap from sklearn.model_selection import train_test_split shap.initjs(); df, targ..
2022.03.25 -
[Day 35] Feature Importances
https://www.codestates.com/ 코딩부트캠프 | 코드스테이츠 - 비전공생도 개발자가 될 수 있습니다 코딩부트캠프를 찾는다면? 개발자로 커리어 전환을 위한 책임있는 코딩 교육 기관! 서비스 기획자, 그로스 마케터, 데이터 사이언티스트 등 다양한 전문 커리어에 도전하세요. 취업 성공의 후기 www.codestates.com Warm-up Bootstrap Aggregating Bagging AdaBoost Gradient Boosting Note 특성 중요도 계산 방법 Feature Importances Drop - Column Importance 순열 중요도 ( Permutation Importance ) import eli5 from eli5.sklearn import Permutati..
2022.03.15 -
[Day 34] Data Wrangling
https://www.codestates.com/ 코딩부트캠프 | 코드스테이츠 - 비전공생도 개발자가 될 수 있습니다 코딩부트캠프를 찾는다면? 개발자로 커리어 전환을 위한 책임있는 코딩 교육 기관! 서비스 기획자, 그로스 마케터, 데이터 사이언티스트 등 다양한 전문 커리어에 도전하세요. 취업 성공의 후기 www.codestates.com Warm-up groupby Note 데이터 랭글링 ( Wrangling ) : 분석을 하거나 모델을 만들기 전에 데이터를 사용하기 쉽게 변형하거나 맵핑하는 과정 Review 더보기 좀 이해하기 어려운 부분이 였던거 같다 참고 더보기
2022.03.15 -
[Day 33] Choose your ML problems
https://www.codestates.com/ 코딩부트캠프 | 코드스테이츠 - 비전공생도 개발자가 될 수 있습니다 코딩부트캠프를 찾는다면? 개발자로 커리어 전환을 위한 책임있는 코딩 교육 기관! 서비스 기획자, 그로스 마케터, 데이터 사이언티스트 등 다양한 전문 커리어에 도전하세요. 취업 성공의 후기 www.codestates.com Warm-up Classification Accuracy Imbalanced Classes Note 타겟설정 이산형, 순서형, 범주형 타겟 특성도 회귀문제 또는 다중클래스 분류문제로 볼 수 있음. 회귀, 다중클래스 분류문제들도 이진 분류모델로 바꿀 수 있음. 정보의 누수 ( Leakage ) 타겟 변수 외에 예측 시점에 사용할 수 없는 데이터가 포함되어 학습이 이루어 질..
2022.03.10