머신러닝을 이해하기 위해서
지금 이 순간의 모습은 모두 본인의 선택으로 인한 것이므로 누구도 탓할 수 없다.
기계학습 ( Machine Learning )
‘어떤 컴퓨터 프로그램이 P에 의해서 측정된 테스크 T에서의 성능이 경험 E를 학습헸다고 할 수 있다’라고 정의하였다.
- 머신러닝에서 중요한 요소는 학습 데이터, loss 함수, 최적화 알고리즘, 그리고 당연하지만 모델 자치입니다.
- 벡터화는 모든것(수학)을 좋게 만들고, (코드를) 빠르게 만들어 줍니다.
머신러닝
과거의 경험을 미래의 결정에 활용하는 소프트웨어를 디자인하고 연구하는 분야다. 달리 말하면 데이터로부터 학습하는 프로그램을 연구하는 것이다. 머신러닝의 근본적인 목표는 규칙들의 적용 사례를 관찰해 그 사이 숨겨진 새로운 규칙을 찾아내고 일반화하는 것이다.
- 스팸 차단
선형회귀
회귀 문제는 주어진 데이터 포인트 x에 해당하는 실제 값으로 주어지는 타겟 y를 예측하는 과제입니다. 회귀 문제는 현실에서 많이 보이는 문제입니다. 예를 들면, 주택 가격, 기존, 판매량 등과 같은 연속된 값을 예측하는 문제들을 들 수 있습니다. 이는 결과 값이서 이미지 분류와 같이 과일의 종류를 예측하는 이산적인 구분문제와는 다릅니다.
로지스틱 회귀
로지스틱 회귀(영어: logistic regression)는 영국의 통계학자인 D. R. Cox가 1958년[1]에 제안한 확률 모델로서 독립 변수의 선형 결합을 이용하여 사건의 발생 가능성을 예측하는데 사용되는 통계 기법이다.
로지스틱 회귀의 목적은 일반적인 회귀 분석의 목표와 동일하게 종속 변수와 독립 변수간의 관계를 구체적인 함수로 나타내어 향후 예측 모델에 사용하는 것이다. 이는 독립 변수의 선형 결합으로 종속 변수를 설명한다는 관점에서는 선형 회귀 분석과 유사하다. 하지만 로지스틱 회귀는 선형 회귀 분석과는 다르게 종속 변수가 범주형 데이터를 대상으로 하며 입력 데이터가 주어졌을 때 해당 데이터의 결과가 특정 분류로 나뉘기 때문에 일종의 분류 (classification) 기법으로도 볼 수 있다.
K-Means
k-Nearet Neighbor
Recurrent Neural Network - 순환신경망
다중회귀
다중선형회귀
최소 자승법
최대우도추정법
RNN-LSTM : 시계열 데이터 처리에 강점
Convolutional Neural Network - 합성곱신경망
역전파 알고리즘
RMSE ( Root Mean Square Error )
NSE ( Nash-Sutcliffe Efficiency )
알아야할 기본 용어
Example과 Sample
머신러닝을 위해서 수집한 데이터는 일반적으로 과거의 경험입니다. 과거의 경험을 통해서 미지의 패턴과 경향을 인식하는 지식을 습득한 후, 새로운 데이터의 결과를 예측하는 것을 목표로 합니다. 이러한 의미에서 수집한 데이터셋은 과거의 경험입니다. 이런 배경으로 볼 때 Example 및 Sample에 적합한 한글 용어는 사례와 견본이라고 할 수 있습니다. 이 중에서 사례가 더 적당한 용어라고 생각합니다.
instance
데이터별로 여러 개의 속성을 가지며, 간 단위 데이터의 속성은 하나의 객체 혹은 인스턴스로 표현할 수 있습니다. 각 사례를 개별적인 특성을 갖는 단위로 묶을 수 있다는 의미에서 인스턴스라고 표현하기도 합니다.
Data Point
다차원 공간에 위치로 표현되는 벡터라는 의미에서 Data Point
행렬곱
선형 방정식
선형 방정식(linear equation)은 우리가 이른 바 연립방정식으로 잘 알고있는 형태입니다. 그 중에서도 1차 연립방정식, 즉 미지수의 차수가 1 이하인 경우를 선형 방정식이라고 합니다. 선형 방정식의 장점은, 행렬을 통해 선형 시스템 Ax = B 로 표현할 수 있다는 점입니다. 선형방정식을 일반화하면 행렬의 곱으로 표현할 수 있습니다.
선형 시스템 풀이의 의미
-
행을 기준으로 바라보면, 모든 조건식들의 교점을 찾는 문제임을 알수 있습니다.
-
열을 기준으로 바라보면, 숫자로만 이루어진 값들에 대해서 벡터로 바라보면, 벡터들의 선형 결합으로 이루어져 있고 그 계수는 스칼라인 값이 됩니다. 이에 대해서 일반화를 해보면,
x1⋅A1+x2⋅A2+ … +xn⋅An=b 으로 표현될 수 있습니다.