일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | ||||||
2 | 3 | 4 | 5 | 6 | 7 | 8 |
9 | 10 | 11 | 12 | 13 | 14 | 15 |
16 | 17 | 18 | 19 | 20 | 21 | 22 |
23 | 24 | 25 | 26 | 27 | 28 |
- five lines challenge
- 정밀도
- 감정은 습관이다
- 강화학습
- ifnull
- sorted
- LAG
- 웹서비스 기획
- 데이터 프로젝트
- recall
- 지도학습
- SQL
- beautifulsoup
- layer normalization
- nvl2
- Batch Normalization
- NULLIF
- Normalization
- CASE WHEN
- 평가 지표
- 오차 행렬
- 비지도학습
- 백엔드
- 데이터 분석
- 데이터 전처리
- 재현율
- 빠르게 실패하기
- NVL
- 결정트리
- DecisionTree
- Today
- Total
목록Machine Learning (16)
Day to_day
❗본 포스팅은 권철민 선생님의 '파이썬 머신러닝 완벽가이드' 강의와 '파이썬 라이브러리를 활용한 머신러닝' 서적을 기반으로 개인적인 정리 목적 하에 재구성하여 작성된 글입니다. 포스팅 개요 이전 포스팅에서 분류 모델의 성능 평가 지표로 정확도, 정밀도, 재현율에 대해서 포스팅했었다. 하지만 정밀도와 재현율만 가지고 모델을 완벽히 평가할 순 없다. 정밀도와 재현율의 맹점에 대해서 알아보고, 정밀도와 재현율을 결합한 지표인 f1 score과 ROC 곡선, AUC에 대해서 포스팅하려 한다. 정밀도와 재현율의 맹점 정밀도와 재현율은 서로 상충하기 때문에 하나의 지표만 최적화시키면 다음과 같은 문제가 발생할 수 있다. 정밀도만을 100%로 최적화하는 법 정말 정확한 한 건의 문제만 예측한다. 그러면 정확하게 하나..
❗본 포스팅은 권철민 선생님의 '파이썬 머신러닝 완벽가이드' 강의와 '파이썬 라이브러리를 활용한 머신러닝' 서적을 기반으로 개인적인 정리 목적 하에 재구성하여 작성된 글입니다. 포스팅 개요 모델의 성능 평가 지표를 공부하다가 계속해서 분류 예측의 불확실성에 대한 개념이 필요해서 이참에 한번 정리하고 진행하기로 했다. 이번 포스팅에선 이진 분류의 불확실성 추정에 대해서, 그리고 불확실성을 추정할 수 있는 함수인 decision_function과 predict_proba에 대해서 간략하게 정리하고 넘어가겠다. 불확실성 추정 불확실성을 추정한다는 것은 예측한 클래스가 무엇인지 뿐만 아니라 정확한 클래스임을 얼마나 확신하는지를 나타내는 것으로써 확률로 나타낼 수 있다. scikit-learn에서 지원하는 불확실..
❗본 포스팅은 권철민 선생님의 '파이썬 머신러닝 완벽가이드' 강의와 '파이썬 라이브러리를 활용한 머신러닝' 서적을 기반으로 개인적인 정리 목적 하에 작성된 글입니다. 포스팅 개요 분류 모델을 공부하면서 가장 쉽고 직관적으로 모델의 성능을 판단할 수 있었던 '정확도(accuracy)'를 보고 모델을 판단했었다. 간단한 예제나 처음 공부할 땐 정확도라는 지표는 쉽게 받아들일 수 있는 개념이었고, 모델이 예측에 성공했느냐 못했느냐 정도만 판단해 평가했다. 하지만 사실 분류 모델의 성능을 판단하기엔 정확도라는 지표는 한계가 있고, 이진 분류 모델에서는 정밀도(precision)와 재현율(recall)이 더 정확한 지표로 사용된다. 분야마다 다른 지표를 사용할 수 있지만 오늘은 정확도의 한계와 오차 행렬에 대해서..
❗들어가기 전에 이 포스팅은 "파이썬 머신러닝" 서적을 읽고 개인적인 정리를 목적으로 작성했음을 알립니다. 머신러닝의 세가지 유형 지도학습 (Supervised Learning) 비지도학습 (Unsupervised Learning) 강화학습 (Reinforcement Learning) 지도학습 레이블이 있는 훈련 데이터로 모델을 학습하여 경험하지 못한 데이터나 미래의 데이터에 관한 예측을 만들어 내는 것이다. 지도학습에는 어떤 것을 예측할 지에 따라 두 가지로 나뉜다. 분류 모델 (classification) 회귀 분석 (regression) 1. 분류 모델 지도 학습의 영역으로 과거 관측치에 기반하여 새로운 인스턴스들의 분류 레이블을 예측하는 것을 목표로 한다. 이러한 분류 레이블은 이산적이고 순위가 ..