회귀 분석

less than 1 minute read

누구에게나 “이거다!” 하는 순간이 온다.
중요한 것은 그 순간에 어떻게 이어나갈 것인지 생각하는 것이다.


y = Wx + b

데이터 포인트들의 집합 x와 예측 값 y는 행렬-벡터 곱의 공식이 됩니다.

x와 y의 관계가 대략 선형적이다.

  • 수학에서 나타내는 1차식 , 1차 함수로 개의 직선으로 그래프가 표현된다. 1개의 일정한 기울기를 가지고 기울기의 변화가 없는 것

1차 선형 방정식으로 그래프 상에서 선형적으로 증가한다.

  • 항목 정의
    • y는 우리가 원하는 값
    • x는 입력데이터
      • w : 가중치 ( 기울기 )
      • b : 편향

y에 대한 x를 정의 할 때 x의 값에 대한 w, b를 구하는 것이 중요

주어진 데이터로 어떤 함수를 만들어 낸 후, 이 함수가 얼마나 정확한지 피팅하는 작업, 통계적 예측에 이용, 가정을 통해 회귀모형을 만들고 이 회귀모형의 적합도를 검정을 통해 확인하는 과정이 필요

Python을 이용한 회귀 분석


from sklearn.linear_model import LinearRegression
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt

df = pd.read_csv("heights.csv")
df.head()

X = df["weight"]
y = df["height"]
#plt.plot(X, y, 'o')
#plt.show()

line_fitter = LinearRegression()
line_fitter.fit(X.values.reshape(-1,1), y)

print(line_fitter.predict([[70]]))

plt.plot(X, y, 'o')
plt.plot(X,line_fitter.predict(X.values.reshape(-1,1)))
plt.show()

  • 그래프 결과