32_Logistic_Regression_로지스틱회귀

2022-07-01 1 분 소요

공부 시간, 과외 시간 성적 사이의 관계는 좌표로
나타낼 때 형태가 직선으로 해결되는 선형 회귀를
사용하기에 적합했었다.
공부 시간에 따른 점수가 아닌 합격 여부로 발표되는
시험이 있을 경우 직선으로 해결하기에는 적합하지
못하는 문제가 발생한다. 이럴 때 사용하는 로지스틱
회귀는 참과 거짓 중에 하나를 내놓는 과정으로 참과
거짓을 구분한 ‘S’자를 눕혀놓은 형태의 선을 그어주는
작업이다.
참조 사이트
http://taewan.kim/post/sigmoid_diff/
https://devlog.jwgo.kr/2018/04/16/sigmoid-graph-according-to-slope-change/

from IPython.display import Image
Image('./sigmoid.png', width ='800')

output_1_0

import warnings 
warnings.filterwarnings('ignore')
import numpy as np
import pandas as pd
import tensorflow.compat.v1 as tf
tf.disable_v2_behavior()

#공부 시간(x), 합격 여부(y) =>[공부 시간, 합격 여부]
data=[[2,0],[4,0],[6,0],[8,1],[10,1],[12,1],[14,1]]
xData=[i[0] for i in data] #공부한 시간
yData=[i[1] for i in data] #합격여부
print(xData)
print(yData)

[2, 4, 6, 8, 10, 12, 14]
[0, 0, 0, 1, 1, 1, 1]

reg

#기울기(a), y절편(b)값을 랜덤하게 정한다.
#random_normal()함수는 tensorflow에서 정규
#분포를 따르는 난수를 발생시킨다.
a = tf.Variable(tf.random_normal([1], dtype=tf.float64))
b = tf.Variable(tf.random_normal([1], dtype=tf.float64))
sess = tf.Session()
sess.run(tf.global_variables_initializer())
print('a={},b={}'.format(sess.run(a),sess.run(b)))

a=[-0.60326647],b=[0.72928339]

#np.e : 넘파이에 지수값(2.718)을 의미하는 상수
#print(np.e)
y = 1/(1+np.e**-(a*xData+b))

시그모이드 방정식의 오차를 계산하는 함수를 만든다.
시그모이드 함수의 특성은 예측값(y)이 항상 0아니면
1이라는 것이다.

sig1

sig2

sig3

sig4

sig5

sig6

sig7

https://ang-love-chang.tistory.com/25

loss = -tf.reduce_mean(np.array(yData) * tf.log(y) +(1-np.array(yData)) * tf.log(1-y))

오차를 최소로 하는 값을 찾는다.

gradient_descent = tf.train.GradientDescentOptimizer(0.1).minimize(loss)

학습시킨다.

sess = tf.Session()
sess.run(tf.global_variables_initializer())

for i in range(320001):
    sess.run(gradient_descent)
    if i % 20000 ==0:
        print('Epock:{0:4d}, loss:{1:10.6f}, 기울기:{2:10.6f}, y절편:{3:10.6f}'
             .format(i, sess.run(loss), sess.run(a)[0], sess.run(b)[0]))

Epock:   0, loss:  1.877932, 기울기: -0.203560, y절편: -0.865261
Epock:20000, loss:  0.021687, 기울기:  2.557518, y절편:-17.748803
Epock:40000, loss:  0.011839, 기울기:  3.175019, y절편:-22.077760
Epock:60000, loss:  0.008110, 기울기:  3.558666, y절편:-24.765468
Epock:80000, loss:  0.006157, 기울기:  3.837153, y절편:-26.715956
Epock:100000, loss:  0.004958, 기울기:  4.055662, y절편:-28.246170
Epock:120000, loss:  0.004148, 기울기:  4.235398, y절편:-29.504755
Epock:140000, loss:  0.003564, 기울기:  4.388015, y절편:-30.573376
Epock:160000, loss:  0.003124, 기울기:  4.520602, y절편:-31.501713
Epock:180000, loss:  0.002780, 기울기:  4.637793, y절편:-32.322229
Epock:200000, loss:  0.002504, 기울기:  4.742783, y절편:-33.057301
Epock:220000, loss:  0.002278, 기울기:  4.837867, y절편:-33.723002
Epock:240000, loss:  0.002089, 기울기:  4.924748, y절편:-34.331265
Epock:260000, loss:  0.001929, 기울기:  5.004726, y절편:-34.891193
Epock:280000, loss:  0.001791, 기울기:  5.078815, y절편:-35.409884
Epock:300000, loss:  0.001672, 기울기:  5.147820, y절편:-35.892983
Epock:320000, loss:  0.001568, 기울기:  5.212394, y절편:-36.345051

Twitter Facebook LinkedIn

Kim-ho-yeon

32_Logistic_Regression_로지스틱회귀

공유하기

댓글남기기

참고

리듬킹2(개인 프로젝트)

리듬킹1(개인 프로젝트)

스도쿠(개인 프로젝트)

미로(개인 프로젝트)