๋ณธ๋ฌธ ๋ฐ”๋กœ๊ฐ€๊ธฐ

AI & ML

[ML] Logistic Rrgression, ๋กœ์ง€์Šคํ‹ฑ ํšŒ๊ท€

๐Ÿ’ก Logistic Regression

๋กœ์ง€์Šคํ‹ฑ ํšŒ๊ท€๋Š” ์ผ๋ฐ˜์ ์ธ ํšŒ๊ท€ ๋ถ„์„์˜ ๋ชฉํ‘œ์™€ ๋™์ผํ•˜๊ฒŒ ์ข…์† ๋ณ€์ˆ˜์™€ ๋…๋ฆฝ ๋ณ€์ˆ˜๊ฐ„์˜ ๊ด€๊ณ„๋ฅผ ๊ตฌ์ฒด์ ์ธ ํ•จ์ˆ˜๋กœ ๋‚˜ํƒ€๋‚ธ๋‹ค. ๋…๋ฆฝ ๋ณ€์ˆ˜์˜ ์„ ํ˜• ๊ฒฐํ•ฉ์œผ๋กœ ์ข…์† ๋ณ€์ˆ˜๋ฅผ ์„ค๋ช…ํ•œ๋‹ค๋Š” ๊ด€์ ์—์„œ ์„ ํ˜• ํšŒ๊ท€ ๋ถ„์„๊ณผ ์œ ์‚ฌํ•˜๋‚˜ ์„ ํ˜• ํšŒ๊ท€ ๋ถ„์„๊ณผ ๋‹ฌ๋ฆฌ ์ข…์† ๋ณ€์ˆ˜๊ฐ€ ๋ฒ”์ฃผํ˜• ๋ฐ์ดํ„ฐ์ด๊ณ  ์ž…๋ ฅ ๋ฐ์ดํ„ฐ๊ฐ€ ์ฃผ์–ด์กŒ์„ ๋•Œ ํ•ด๋‹น ๋ฐ์ดํ„ฐ์˜ ๊ฒฐ๊ณผ๊ฐ€ ํŠน์ • ๋ถ„๋ฅ˜๋กœ ๋‚˜๋‰˜๊ธฐ ๋•Œ๋ฌธ์— ์ผ์ข…์˜ ๋ถ„๋ฅ˜(classification) ๊ธฐ๋ฒ•์œผ๋กœ๋„ ๋ณผ ์ˆ˜๋„ ์žˆ๋‹ค.



Sigmoid Function

๊ทธ๋ฆผ์„ ๋ณด๋ฉด ์„ ํ˜•ํšŒ๊ท€ ๋ฐฉ์‹์œผ๋กœ๋Š” ๋ฐ์ดํ„ฐ์— ๋”ฐ๋ฅธ ๊ฒฐ๊ณผ๋ฅผ ์ •ํ™•ํžˆ ์˜ˆ์ธกํ•˜๊ธฐ ํž˜๋“ค๋‹ค. ๋”ฐ๋ผ์„œ Sigmoid function์„ ์ด์šฉํ•ด hypothesis๋ฅผ ์ˆ˜์ •ํ•ด์ค€๋‹ค. sigmoid function์€ ์‰ฝ๊ฒŒ ๋งํ•ด hypothesis์˜ ๋ฒ”์œ„๋ฅผ 0๊ณผ 1 ์‚ฌ์ด๋กœ ์••์ถ•ํ•ด์ค€๋‹ค. ํ•จ์ˆ˜๋Š” ๋‹ค์Œ๊ณผ ๊ฐ™๋‹ค.
$$g(z) = \cfrac{e^z}{e^z+1} = \cfrac{1}{1+e^{-z}}$$
์ด๋•Œ $z = WX$ ์ฆ‰, hypothesis๋ฅผ ์˜๋ฏธํ•œ๋‹ค.

Hypothesis

sigmoid function์„ ์ด์šฉํ•œ hypothesis๋Š” ๋‹ค์Œ๊ณผ ๊ฐ™๋‹ค.
$$H(X)=\cfrac{1}{1+e^{-W^TX}}$$

Cost Function

์ด์ œ Cost function์„ ๊ตฌํ•˜๋ฉด $cost(W) = \frac{1}{m}\Sigma(H(X)-y)^2$์ด ๋˜๊ณ , ํ•จ์ˆ˜๋ฅผ ๊ทธ๋ฆฌ๋ฉด ์•„๋ž˜์™€ ๊ฐ™๋‹ค.



๊ทธ๋ž˜ํ”„์˜ ๊ฐœํ˜•์„ ๋ณด๋ฉด convex function์ด ์•„๋‹ˆ๋ผ๋Š” ๊ฒƒ์„ ์•Œ ์ˆ˜ ์žˆ๋‹ค. ์ด cost function์„ ์ด์šฉํ–ˆ์„ ๋•Œ local minimum๊ณผ global minimum์ด ๊ฐ™์ง€ ์•Š์•„ ์ž˜๋ชป๋œ ๊ฐ’์„ ์ถ”์ •ํ•  ์ˆ˜ ์žˆ์œผ๋ฏ€๋กœ ๋‹ค๋ฅธ cost function์„ ์‚ฌ์šฉํ•ด์•ผํ•  ๊ฒƒ์ด๋‹ค. ๊ฒฐ๊ณผ์ ์œผ๋กœ ์•„๋ž˜์™€ ๊ฐ™์€ ์ˆ˜์‹์œผ๋กœ ํ‘œํ˜„๋œ๋‹ค.
$$cost(W)=\cfrac{1}{m}\Sigma c(H(x),y)$$
์ด๋•Œ c ํ•จ์ˆ˜๋Š” ์•„๋ž˜์™€ ๊ฐ™๋‹ค.
$$c(H(x), y)= -log(H(x)) : y=1$$
$$c(H(x), y)= -log(1-H(x)):y=0$$
ํ•จ์ˆ˜๋ฅผ ๊ทธ๋ฆฌ๋ฉด ์•„๋ž˜ ๊ทธ๋ฆผ๊ณผ ๊ฐ™๊ฒŒ ๋˜๋Š”๋ฐ ๊ทธ๋ž˜ํ”„๋ฅผ ๋ณด๋ฉด convex function์ž„์„ ์•Œ ์ˆ˜ ์žˆ๋‹ค.



ํ•จ์ˆ˜๋ฅผ ๊ฐ„์†Œํ™” ํ•˜๋ฉด $c(H(x), y) = - ylog(H(x)) - (1-y)log(1-H(x))$์ด ๋˜๊ณ  ์ด ํ•จ์ˆ˜๋Š” convex function์ด๋ฏ€๋กœ cost function์— ์ ์šฉํ•˜๋ฉด
$$cost(W) = -\cfrac{1}{m}\Sigma \big{ ylog(H(x)) - (1-y)log(1-H(x))\big}$$
์œ„์™€ ๊ฐ™์€ ์‹์œผ๋กœ ํ‘œํ˜„๋œ๋‹ค.

์ด์ œ cost function์„ ํ†ตํ•ด minimized W๋ฅผ ๊ตฌํ•  ์ˆ˜ ์žˆ๊ฒŒ ๋œ๋‹ค. cost function๊ณผ ํŽธ๋ฏธ๋ถ„์„ ํ†ตํ•ด W๋ฅผ ์กฐ์ •ํ•  ์ˆ˜ ์žˆ๋Š”๋ฐ ์‹์€ ๋‹ค์Œ๊ณผ ๊ฐ™๋‹ค.
$$W:=W-\alpha\cfrac{\partial}{\partial x}cost(W)$$


ํ…์„œํ”Œ๋กœ์šฐ ๋“ฑ์—์„œ minimizeํ•˜๋Š” ๋ฉ”์†Œ๋“œ๋ฅผ ์ œ๊ณตํ•˜๋ฏ€๋กœ ์ง์ ‘ ๊ณ„์‚ฐํ•  ํ•„์š”๋Š” ์—†๋‹ค.

'AI & ML' ์นดํ…Œ๊ณ ๋ฆฌ์˜ ๋‹ค๋ฅธ ๊ธ€

[DL] RNN, Recursive Neural Network  (0) 2024.02.25
[DL] CNN, Convolution Neural Network  (0) 2024.02.24
[ML] Linear Regression, ์„ ํ˜•ํšŒ๊ท€  (0) 2024.01.20