1 분 소요

:octocat: modeling

DecisionTree

장점
baseline model로 좋다
부스팅 모델의 기반이고 빠르며, 피처 중요도 보기 좋음
단점
랜덤성에 따라 결과 또는 성능의 변동 폭이 크다
계층적 접근 방식이기 때문에 중간에 에러 발생하면 다음 단계로 에러가 계속 전파
노이즈에 민감하다 ~ 과적합 가능성, 일반화하여 사용하기 어렵다

랜덤포레스트

bagging : bootstrap + aggregating
조금씩 다른 훈련 데이터에 대해 훈련된 기초 분류기(base learner)들을 결합(aggregating)시키는 방법이다.
비상관화된 여러 트리들의 집계는 노이즈에 대해 강인
랜덤화를 통해 좋은 일반화 성능

주요 파라미터

n_estimators : 트리수
n_jobs=k : Parallelization, -1 일때는 사용가능한 모든 코어 사용)

트리가 많아서 시각화 하기가 힘들다
시각화 방법

검증

  • Hold-out Validation
    빠르게 평가가 가능
  • Cross Validation
    장점
    모든 데이터 셋을 평가에 활용할 수 있고, 평가에 사용되는 데이터셋의 편향을 막을 수 있다
    => 데이터 부족으로 인한 underfitting 방지
    => 평가 결과에 따라 좀 더 일반화된 모델을 만들 수 있다
    ~ 정확도를 향상시킬 수 있다.

단점 모델 훈련 및 평가 시간이 오래 걸린다

평가

  • MAE(Mean Absolute Error)
  • R^2 결정계수

오늘의 이모저모


기타사항
wandb : 튜닝을 하고 기록을 해주는 라이브러리

:bulb:올바른 이력서 쓰기
날짜순 내림차순
zip x
본인 소개엔 기여점 쓰기. 기술 / 협업 / 소통
기술스택 - 할 수 있는 것(주력기술)들 모호하지않게 한줄정리
무관한 경력이라도 쓰는 것 추천. 조직생활 경험이나 성실성 등을 보여줄 수 있다. 어떻게 풀어쓰느냐!
이력서


:bookmark:출처 - DecisionTree
https://scikit-learn.org/stable/index.html
https://scikit-learn.org/stable/tutorial/machine_learning_map/index.html
- RandomForest
asdasdsadsad
https://github.com/andosa/treeinterpreter
- 99CON : 주니어 개발자의 이력서 쓰기 - 이동욱
https://speakerdeck.com/weirdx/99con-junieo-gaebaljayi-iryeogseo-sseugi-idongug
https://jojoldu.github.io/


:mortar_board:포스팅 공지

작성한 포스팅은 멋쟁이 사자처럼 AI SCHOOl의 수업 내용입니다.

태그:

카테고리:

업데이트:

댓글남기기