1. 머신러닝
기존의 데이터를 알고리즘을 사용해 모델을 만들어내고, 새로운 데이터에 해당 모델을 적용시켜 패턴을 학습하거나 결과를 추론하는 기법
-> 핵심은 머신러닝 알고리즘 & 모델
2. 알고리즘
어떠한 문제를 풀기 위한 과정, Model을 생성하기 위한 (훈련) 과정 : training process
3. 모델
예측을 위한 수학 공식, 함수, 1차 방정식, 확률분포, condition rule(If문, 조건절)
4. 모델을 학습할 때 고려요인들
y 값에 영향을 주는 x 값은 하나가 아니다 - > 여러 개의 x 값들이 존재
5. Feature
- 머신러닝에서 데이터의 특징을 나타내는 변수
- feature, 독립변수, input 변수 등은 동일의미로 사용
- 일반적으로 Table 상에 Data를 표현할 때, Column을 의미
- 하나의 data instance (실제 데이터)는 feature vector로 표현
6. Feature Vector
- 하나의 Feature에 속하는 data들을 element로 하는 vector
X = [x_col1, x_col2, ... , x_coln]
7. Terminology
- Data Table, Sample : 전체 데이터 테이블
- Feature(Column, Attribute) : Data Table의 세로줄, ML에서 데이터의 특징을 나타내는 변수
- Instance(Tuple, Row) : Data Table의 가로줄
- Feature Vector : Data Table의 column vector