일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | ||||||
2 | 3 | 4 | 5 | 6 | 7 | 8 |
9 | 10 | 11 | 12 | 13 | 14 | 15 |
16 | 17 | 18 | 19 | 20 | 21 | 22 |
23 | 24 | 25 | 26 | 27 | 28 |
- DecisionTree
- 결정트리
- SQL
- 오차 행렬
- NVL
- five lines challenge
- 데이터 분석
- 평가 지표
- layer normalization
- beautifulsoup
- recall
- 지도학습
- ifnull
- 백엔드
- 데이터 프로젝트
- Normalization
- CASE WHEN
- 데이터 전처리
- nvl2
- 정밀도
- 웹서비스 기획
- 강화학습
- 재현율
- Batch Normalization
- 비지도학습
- NULLIF
- sorted
- LAG
- 빠르게 실패하기
- 감정은 습관이다
- Today
- Total
목록Tech blog (76)
Day to_day
![](http://i1.daumcdn.net/thumb/C150x150.fwebp.q85/?fname=https://blog.kakaocdn.net/dn/ZtNo0/btrYTg4yCBu/95FIYE1JfYsXsvWHPLFHR1/img.png)
❗본 포스팅은 권철민 선생님의 '파이썬 머신러닝 완벽가이드' 강의와 '파이썬 라이브러리를 활용한 머신러닝' 서적을 기반으로 개인적인 정리 목적 하에 재구성하여 작성된 글입니다. 포스팅 개요 이전 포스팅에서 분류 모델의 성능 평가 지표로 정확도, 정밀도, 재현율에 대해서 포스팅했었다. 하지만 정밀도와 재현율만 가지고 모델을 완벽히 평가할 순 없다. 정밀도와 재현율의 맹점에 대해서 알아보고, 정밀도와 재현율을 결합한 지표인 f1 score과 ROC 곡선, AUC에 대해서 포스팅하려 한다. 정밀도와 재현율의 맹점 정밀도와 재현율은 서로 상충하기 때문에 하나의 지표만 최적화시키면 다음과 같은 문제가 발생할 수 있다. 정밀도만을 100%로 최적화하는 법 정말 정확한 한 건의 문제만 예측한다. 그러면 정확하게 하나..
![](http://i1.daumcdn.net/thumb/C150x150.fwebp.q85/?fname=https://blog.kakaocdn.net/dn/xoLEb/btrYUS9O3DV/m2iBo9OZMHkfb0wu5nbcvK/img.png)
❗본 포스팅은 권철민 선생님의 '파이썬 머신러닝 완벽가이드' 강의와 '파이썬 라이브러리를 활용한 머신러닝' 서적을 기반으로 개인적인 정리 목적 하에 재구성하여 작성된 글입니다. 포스팅 개요 모델의 성능 평가 지표를 공부하다가 계속해서 분류 예측의 불확실성에 대한 개념이 필요해서 이참에 한번 정리하고 진행하기로 했다. 이번 포스팅에선 이진 분류의 불확실성 추정에 대해서, 그리고 불확실성을 추정할 수 있는 함수인 decision_function과 predict_proba에 대해서 간략하게 정리하고 넘어가겠다. 불확실성 추정 불확실성을 추정한다는 것은 예측한 클래스가 무엇인지 뿐만 아니라 정확한 클래스임을 얼마나 확신하는지를 나타내는 것으로써 확률로 나타낼 수 있다. scikit-learn에서 지원하는 불확실..
![](http://i1.daumcdn.net/thumb/C150x150.fwebp.q85/?fname=https://blog.kakaocdn.net/dn/DgBSJ/btrX8hC1711/D5kGyxSVW5Sf0IKUINNrXK/img.png)
포스팅 개요 SQL의 LIMIT 기본 문법을 정리하고, 리트코드 문제로 LIMIT 구문을 응용해 보기 위해서 포스팅을 작성한다. 기본 문법 LIMIT는 결과에서 몇 개의 행을 반환할 것인지 제한하는 구문이다. 두 가지의 방법으로 LIMIT를 활용 할 수 있다. LIMIT 구문은 SELECT 명령의 마지막에 지정하는 것으로 WHERE이나 ORDER BY 구문의 뒤에 위치한다. SELECT 컬럼명 FROM 테이블명 LIMIT 개수; SELECT 컬럼명 FROM 테이블명 LIMIT 개수 OFFSET 시작 인덱스; 1. LIMIT 개수 이때 LIMIT 뒤에 숫자가 인덱스가 아닌 개수를 의미하는 것을 유의해야 한다. SELECT * FROM BOOK LIMIT 1; 맨 위에 있는 행 한 개만 추..
![](http://i1.daumcdn.net/thumb/C150x150.fwebp.q85/?fname=https://blog.kakaocdn.net/dn/dbHF2I/btrXSxgsMl3/nGfU44LTvR7VM2RRvBxlOK/img.png)
❗본 포스팅은 권철민 선생님의 '파이썬 머신러닝 완벽가이드' 강의와 '파이썬 라이브러리를 활용한 머신러닝' 서적을 기반으로 개인적인 정리 목적 하에 작성된 글입니다. 포스팅 개요 분류 모델을 공부하면서 가장 쉽고 직관적으로 모델의 성능을 판단할 수 있었던 '정확도(accuracy)'를 보고 모델을 판단했었다. 간단한 예제나 처음 공부할 땐 정확도라는 지표는 쉽게 받아들일 수 있는 개념이었고, 모델이 예측에 성공했느냐 못했느냐 정도만 판단해 평가했다. 하지만 사실 분류 모델의 성능을 판단하기엔 정확도라는 지표는 한계가 있고, 이진 분류 모델에서는 정밀도(precision)와 재현율(recall)이 더 정확한 지표로 사용된다. 분야마다 다른 지표를 사용할 수 있지만 오늘은 정확도의 한계와 오차 행렬에 대해서..
![](http://i1.daumcdn.net/thumb/C150x150.fwebp.q85/?fname=https://blog.kakaocdn.net/dn/be9HXX/btrXN6pmKwK/M3UJOka0fJuORkTZteiHk0/img.jpg)
글 쓰는 또라이가 세상을 바꾼다.글또 8기에 참가하게 되었다. 몇 년 전에 글을 쓰는 커뮤니티도 참여해봤었는데 자유 주제로 부담 없이 습관을 위한 글을 썼기 때문에 그리 어려움은 없었다. 그런데 글또는 기술 블로그를 가꾸는 것이기에 좀 더 쉽게 써지진 않을 것 같다. 하지만 공들여 쓰는 것만큼 더 성장하리라 기대한다. 본격적으로 글또 활동을 하기 앞서 간략(?)하게 스케치하고 시작하려고 한다. 글또를 통해서 내가 무엇을 이룰 것인가?어떤 행동을 할 땐 이유를 찾고 시작하길 좋아한다. 특히 습관을 만들 땐 더더욱 동기가 중요하다. 그래서 키워드를 중심으로 내가 시작해야 하는 이유를 적어보았다. 1. 굴러 나아갈 수 있는 힘진로를 바꾸기로 결정한 지.. 약 한 달째 되어가는 것 같다. 이미 나는 취준생으..
![](http://i1.daumcdn.net/thumb/C150x150.fwebp.q85/?fname=https://blog.kakaocdn.net/dn/beX2MG/btrWu7cel38/sMUOtbQIyD1Kyj7N2fsgB1/img.png)
Stack LIFO (Last In First Output) : 가장 나중에 들어온 것이 가장 먼저 나간다. 더미처럼 쌓여있는 구조를 생각하면 된다. 그릇이 쌓여있으면 가장 나중에 쌓은 맨 위에 있는 그릇을 가장 먼저 빼는 것은 당연하게 생각할 수 있다. pop() : 스택에서 가장 위에 있는 항목을 제거한다. push(item) : item 하나를 스택의 가장 윗 부분에 추가한다. Stack 자료 구조의 사용 사례 웹 브라우저 뒤로 가기 실행 취소 (undo) 역순 문자열 만들기 후위 표기법 계산 (연산자가 피연산자 뒤쪽에 위치하는 것) 큐 (Queue) FIFO (First In First Out) : 먼저 들어온 것이 먼저 나가는 방법 (선입선출) 카페에 줄서있는 손님들을 생각하면 된다. 긴 줄을 ..