일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | ||||||
2 | 3 | 4 | 5 | 6 | 7 | 8 |
9 | 10 | 11 | 12 | 13 | 14 | 15 |
16 | 17 | 18 | 19 | 20 | 21 | 22 |
23 | 24 | 25 | 26 | 27 | 28 |
- 강화학습
- 비지도학습
- 재현율
- CASE WHEN
- ifnull
- NVL
- sorted
- Normalization
- nvl2
- five lines challenge
- layer normalization
- LAG
- NULLIF
- 결정트리
- 데이터 전처리
- 지도학습
- 데이터 분석
- 오차 행렬
- Batch Normalization
- 웹서비스 기획
- DecisionTree
- 데이터 프로젝트
- 정밀도
- beautifulsoup
- 평가 지표
- 백엔드
- recall
- 빠르게 실패하기
- 감정은 습관이다
- SQL
- Today
- Total
목록전체 글 (76)
Day to_day
❗본 포스팅은 권철민 선생님의 '파이썬 머신러닝 완벽가이드' 강의와 '파이썬 라이브러리를 활용한 머신러닝' 서적을 기반으로 개인적인 정리 목적 하에 재구성하여 작성된 글입니다. 포스팅 개요 회귀 분석의 개념과 목적에 대해서 개요 정도로 설명하고 구체적인 내용은 다음 포스팅에 담아보겠다. 회귀 분석의 목적 회귀 분석은 독립변수와 종속변수 간의 함수 관계를 규명하는 통계적 방법이다. 머신러닝 회귀 예측의 핵심은 주어진 피처와 결정 값 데이터를 기반으로 학습을 통해 최적의 회귀 계수를 찾아내는 것이다. 만약 아파트 가격을 예측하려고 하는 회귀 분석을 하려고 한다면 ‘아파트 가격’이라는 종속변수에 영향을 주는 여러 가지 요소들이 있을 것이다. 예를 들면, 방의 개수, 아파트 크기, 주변 편의시설 등.. 그러한 ..
❗본 포스팅은 다크프로그래머의 '카메라 캘리브레이션'과 '좌표계' 포스팅을 기반으로 개인적인 정리 목적 하에 재구성하여 작성된 글입니다. 포스팅 개요 컴퓨터 비전 분야에서 꼭 필요한 기본적인 내용이 카메라 캘리브레이션에 대한 내용이다. 직접 카메라 캘리브레이션을 코드를 짜보며 그 결과를 얻어 카메라 내부 파라미터와 외부 파라미터는 어떤 것인지에 대해서 알아보고자 한다. 일단 카메라 캘리브레이션을 하는 목적을 알기 전에 기본적으로 알고 넘어가면 좋을 좌표계의 개념과 좌표계 변환에 대한 이론을 정리하고 카메라 캘리브레이션에 대해 알아보겠다. 좌표계 우리가 카메라로 어떤 영상을 촬영하면, 카메라 영상은 3차원 공간상의 점들을 2차원 이미지 평면에 투사함으로써 얻어진다. 그때 알아야 하는 좌표계는 다음과 같다...
❗본 포스팅은 권철민 선생님의 '파이썬 머신러닝 완벽가이드' 강의와 '파이썬 라이브러리를 활용한 머신러닝' 서적을 기반으로 개인적인 정리 목적 하에 재구성하여 작성된 글입니다. 포스팅 개요 분류 모델을 쭉 살펴보며 이름은 회귀가 들어가지만 분류 기법에 해당하는 '로지스틱 회귀'를 정리하려고 한다. 로지스틱 회귀란 무엇이고, 어떻게 사용할 수 있는지에 대해 가볍게 알아가고 넘어가겠다. 로지스틱 회귀 Logistic Regression 로지스틱 회귀는 선형 회귀 방식을 분류에 적용한 알고리즘이다. Linear regression은 주어진 feature에 따라 예측 결괏값이 연속적이었다. 하지만 Logistic Regression은 타깃값이 연속적인 것이 아닌, 범주형이면서 0 또는 1인 경우 사용한다. 로지..
❗본 포스팅은 권철민 선생님의 '파이썬 머신러닝 완벽가이드' 강의와 '파이썬 라이브러리를 활용한 머신러닝' 서적을 기반으로 개인적인 정리 목적 하에 재구성하여 작성된 글입니다. 포스팅 개요 저번 포스팅에 이어서 데이터 인코딩에 대해서 적어보고 데이터 인코딩의 종류인 라벨 인코딩과 원-핫 인코딩에 대해서 자세히 알아보려고 한다. 데이터 인코딩의 목적 sci-kit learn의 ML은 문자열 값을 입력값으로 허용하지 않는다. 그렇기 때문에 모든 문자열 값은 인코딩을 해서 숫자형으로 변환해야 한다. 데이터의 표현 - 범주형 특성 범주형 데이터라는 것은 카테고리처럼 연속된 값이 아니고 값에 대소가 있지 않고, 중간값이 있는 게 아닌 데이터이다. 예를 들어 책, 옷, 하드웨어 이런 것은 책과 옷 사이에는 중간 값..
❗본 포스팅은 권철민 선생님의 '파이썬 머신러닝 완벽가이드' 강의와 '파이썬 라이브러리를 활용한 머신러닝' 서적을 기반으로 개인적인 정리 목적 하에 재구성하여 작성된 글입니다. 포스팅 개요 Feature Engineering이란 무엇인지, 그리고 어떤 기법들이 있는지에 대해서 살펴보고 이번 포스팅에서는 Feature Engineering 중에서 이상치 제거, 결측치 처리, log 변환에 대해서 알아보고, 실습코드를 구현해 보겠다. Feature Engineering이란? Feature Engineering은 모델 정확도를 높이기 위해서 주어진 데이터를 예측 모델의 문제를 잘 표현할 수 있는 features로 변형시키는 과정이다. Feature Engineering의 종류 여러 가지가 존재하지만 그중에 내..
❗본 포스팅은 권철민 선생님의 '파이썬 머신러닝 완벽가이드' 강의와 '파이썬 라이브러리를 활용한 머신러닝' 서적을 기반으로 개인적인 정리 목적 하에 재구성하여 작성된 글입니다. 포스팅 개요 앙상블 모델인 stacking 모델의 동작 과정에 대해 알아보고, 예제 코드와 stacking 모델의 장단점까지 알아보려고 한다. 아마 앙상블 모델의 마지막 포스팅이 될 듯하다. 스태킹 모델 Stacking model 앙상블처럼 개별 모델을 조합해서 메타 모델이 최종 예측을 하는 방법이다. 배깅, 부스팅과 가장 큰 차이점은 개별 알고리즘으로 예측한 데이터를 기반으로 다시 예측을 수행한다는 것이다. 핵심은 여러 개별 모델의 예측 데이터를 각각 스태킹 형태로 결합해 최종 메타 모델의 학습용 feature dataset과 ..