[ML] Logistic Rrgression, ๋ก์ง์คํฑ ํ๊ท
๐ก Logistic Regression
๋ก์ง์คํฑ ํ๊ท๋ ์ผ๋ฐ์ ์ธ ํ๊ท ๋ถ์์ ๋ชฉํ์ ๋์ผํ๊ฒ ์ข
์ ๋ณ์์ ๋
๋ฆฝ ๋ณ์๊ฐ์ ๊ด๊ณ๋ฅผ ๊ตฌ์ฒด์ ์ธ ํจ์๋ก ๋ํ๋ธ๋ค. ๋
๋ฆฝ ๋ณ์์ ์ ํ ๊ฒฐํฉ์ผ๋ก ์ข
์ ๋ณ์๋ฅผ ์ค๋ช
ํ๋ค๋ ๊ด์ ์์ ์ ํ ํ๊ท ๋ถ์๊ณผ ์ ์ฌํ๋ ์ ํ ํ๊ท ๋ถ์๊ณผ ๋ฌ๋ฆฌ ์ข
์ ๋ณ์๊ฐ ๋ฒ์ฃผํ ๋ฐ์ดํฐ์ด๊ณ ์
๋ ฅ ๋ฐ์ดํฐ๊ฐ ์ฃผ์ด์ก์ ๋ ํด๋น ๋ฐ์ดํฐ์ ๊ฒฐ๊ณผ๊ฐ ํน์ ๋ถ๋ฅ๋ก ๋๋๊ธฐ ๋๋ฌธ์ ์ผ์ข
์ ๋ถ๋ฅ(classification) ๊ธฐ๋ฒ์ผ๋ก๋ ๋ณผ ์๋ ์๋ค.
Sigmoid Function
๊ทธ๋ฆผ์ ๋ณด๋ฉด ์ ํํ๊ท ๋ฐฉ์์ผ๋ก๋ ๋ฐ์ดํฐ์ ๋ฐ๋ฅธ ๊ฒฐ๊ณผ๋ฅผ ์ ํํ ์์ธกํ๊ธฐ ํ๋ค๋ค. ๋ฐ๋ผ์ Sigmoid function์ ์ด์ฉํด hypothesis๋ฅผ ์์ ํด์ค๋ค. sigmoid function์ ์ฝ๊ฒ ๋งํด hypothesis์ ๋ฒ์๋ฅผ 0๊ณผ 1 ์ฌ์ด๋ก ์์ถํด์ค๋ค. ํจ์๋ ๋ค์๊ณผ ๊ฐ๋ค.
$$g(z) = \cfrac{e^z}{e^z+1} = \cfrac{1}{1+e^{-z}}$$
์ด๋ $z = WX$ ์ฆ, hypothesis๋ฅผ ์๋ฏธํ๋ค.
Hypothesis
sigmoid function์ ์ด์ฉํ hypothesis๋ ๋ค์๊ณผ ๊ฐ๋ค.
$$H(X)=\cfrac{1}{1+e^{-W^TX}}$$
Cost Function
์ด์ Cost function์ ๊ตฌํ๋ฉด $cost(W) = \frac{1}{m}\Sigma(H(X)-y)^2$์ด ๋๊ณ , ํจ์๋ฅผ ๊ทธ๋ฆฌ๋ฉด ์๋์ ๊ฐ๋ค.
๊ทธ๋ํ์ ๊ฐํ์ ๋ณด๋ฉด convex function์ด ์๋๋ผ๋ ๊ฒ์ ์ ์ ์๋ค. ์ด cost function์ ์ด์ฉํ์ ๋ local minimum๊ณผ global minimum์ด ๊ฐ์ง ์์ ์๋ชป๋ ๊ฐ์ ์ถ์ ํ ์ ์์ผ๋ฏ๋ก ๋ค๋ฅธ cost function์ ์ฌ์ฉํด์ผํ ๊ฒ์ด๋ค. ๊ฒฐ๊ณผ์ ์ผ๋ก ์๋์ ๊ฐ์ ์์์ผ๋ก ํํ๋๋ค.
$$cost(W)=\cfrac{1}{m}\Sigma c(H(x),y)$$
์ด๋ c ํจ์๋ ์๋์ ๊ฐ๋ค.
$$c(H(x), y)= -log(H(x)) : y=1$$
$$c(H(x), y)= -log(1-H(x)):y=0$$
ํจ์๋ฅผ ๊ทธ๋ฆฌ๋ฉด ์๋ ๊ทธ๋ฆผ๊ณผ ๊ฐ๊ฒ ๋๋๋ฐ ๊ทธ๋ํ๋ฅผ ๋ณด๋ฉด convex function์์ ์ ์ ์๋ค.
ํจ์๋ฅผ ๊ฐ์ํ ํ๋ฉด $c(H(x), y) = - ylog(H(x)) - (1-y)log(1-H(x))$์ด ๋๊ณ ์ด ํจ์๋ convex function์ด๋ฏ๋ก cost function์ ์ ์ฉํ๋ฉด
$$cost(W) = -\cfrac{1}{m}\Sigma \big{ ylog(H(x)) - (1-y)log(1-H(x))\big}$$
์์ ๊ฐ์ ์์ผ๋ก ํํ๋๋ค.
์ด์ cost function์ ํตํด minimized W๋ฅผ ๊ตฌํ ์ ์๊ฒ ๋๋ค. cost function๊ณผ ํธ๋ฏธ๋ถ์ ํตํด W๋ฅผ ์กฐ์ ํ ์ ์๋๋ฐ ์์ ๋ค์๊ณผ ๊ฐ๋ค.
$$W:=W-\alpha\cfrac{\partial}{\partial x}cost(W)$$
ํ ์ํ๋ก์ฐ ๋ฑ์์ minimizeํ๋ ๋ฉ์๋๋ฅผ ์ ๊ณตํ๋ฏ๋ก ์ง์ ๊ณ์ฐํ ํ์๋ ์๋ค.