머신러닝의 유형? 알고 넘어가기!

Notice

Recent Posts

Recent Comments

Link

« 2024/05 »
일	월	화	수	목	금	토
			1	2	3	4
5	6	7	8	9	10	11
12	13	14	15	16	17	18
19	20	21	22	23	24	25
26	27	28	29	30	31

Tags more

Archives

Today

Total

관리 메뉴

Day to_day

머신러닝의 유형? 알고 넘어가기! 본문

Machine Learning

머신러닝의 유형? 알고 넘어가기!

m_inglet 2023. 1. 18. 01:04

728x90

❗들어가기 전에 이 포스팅은 "파이썬 머신러닝" 서적을 읽고 개인적인 정리를 목적으로 작성했음을 알립니다.

머신러닝의 세가지 유형

지도학습 (Supervised Learning)
비지도학습 (Unsupervised Learning)
강화학습 (Reinforcement Learning)

지도학습

레이블이 있는 훈련 데이터로 모델을 학습하여 경험하지 못한 데이터나 미래의 데이터에 관한 예측을 만들어 내는 것이다.

지도학습에는 어떤 것을 예측할 지에 따라 두 가지로 나뉜다.

분류 모델 (classification)
회귀 분석 (regression)

1. 분류 모델

지도 학습의 영역으로 과거 관측치에 기반하여 새로운 인스턴스들의 분류 레이블을 예측하는 것을 목표로 한다. 이러한 분류 레이블은 이산적이고 순위가 없는 특징의 값(범주형)들로 각 인스턴스가 그룹에 속하는지에 관한 것이라고 할 수 있다.

예) 스팸 메일인지 아닌지 구분하기

2. 회귀분석

연속형 결과를 예측하는 것으로 회귀분석으로 불리기도 한다. 회귀 분석에서는 복수 개의 예측(설명) 변수들과 하나의 연속형 반응 변수(결과)가 주어진다. 그리고 이러한 변수들 간의 관계를 찾아서 결과를 예측하게 된다.

예) ‘시험 공부에 투자하는 시간’이 데이터라고 하면 미래 시험 점수를 예측

주어진 예측 변수 x가 있고, 하나의 반응 변수 y가 있다고 할 때, 우리는 샘플 점들과 피팅될 선 간의 거리(일반적으로는 평균 제곱 거리)를 최소화하는 하나의 직선을 피팅할 수 있다. 즉 오차를 최소화하는 선을 만든다는 말이다.

비지도 학습

비지도 학습에서는 레이블이 없는 데이터를 다루거나 구조를 모르는 데이터를 다룬다. 비지도 학습 기법을 이용하면 알려진 결과변수나 보상함수의 도움을 받지 않고서도 데이터 구조를 탐색하여 의미 있는 정보를 추출할 수 있다.

비지도 학습을 이용한 기법

1. 군집분석을 활용하여 서브 그룹찾기

각각의 군집은 특정 수준의 유사도는 공유하나, 다른 군집들 내의 오브젝트와는 훨씬 덜 비슷한 차이를 갖는다. 군집분석은 정보를 구조화하고 데이터 간 의미 있는 관계를 파생하는 데 아주 좋은 기법이다.
군집분석은 그룹 요소에 대한 어떤 사전 지식 없이도 정보의 더미를 의미있는 서브 그룹(군집)으로 구조화할 수 있게 해주는 탐색적 데이터 분석 기법이다.