Supervised Learning : Supervised Learning
ML model
- Supervised model(지도학습) : label 有
- Unsupervised model(비지도학습) : label 無
→ 원시데이터를 보고 자연스럽게 그룹으로 분류되는지 발견하는 것
지도 학습에서는 레이블, 이제껏 축적되어온 과거 데이터로 미래 데이터를 예측한다.
ex) 총 식사비와 그에 대한 팁 값에 대한 데이터가 축적되어 있을 때, 어떤 손님에 대하여 총 식사비는 알지만 팁이 얼마일지 모르는 상황에서 팁=레이블 이라고 볼 수 있다. 이제 총 식사비를 통해 팁을 예측하는 모델을 생성하면 팁이 얼마인지 예측할 수 있다.
Supervised model
- Regression(회귀 모델) : 레이블 값이 연속적
- Classification(분류 모델) : 레이블 값이 이산적
ex)
데이터셋 (컬럼 : feature(특징), 로우 : Example(예제))
총 식사비 | 팁 | 성별 |
16.99 | 1.01 | 여 |
10.34 | 1.66 | 남 |
21.01 | 3.5 | 남 |
23.68 | 3.31 | 여 |
데이터셋이 주어지면 예측하려는 특징 값을 레이블로 이용한다
- 팁을 레이블로 선택 → 연속적인 값을 가지기 때문에 회귀모델
- 성별을 레이블로 선택 → 이산적인 값을 가지기 때문에 분류 모델
결과적으로 해답을 찾기 위해 머신 러닝 모델을 이용하려면 해결하려는 문제, 가지고 있는 데이터 등을 고려해 어떤 머신 러닝 모델을 이용해야 하는지 결정해야 한다.