Processing math: 100%
๋ณธ๋ฌธ ๋ฐ”๋กœ๊ฐ€๊ธฐ

AI & ML

[ML] Logistic Rrgression, ๋กœ์ง€์Šคํ‹ฑ ํšŒ๊ท€

๐Ÿ’ก Logistic Regression

๋กœ์ง€์Šคํ‹ฑ ํšŒ๊ท€๋Š” ์ผ๋ฐ˜์ ์ธ ํšŒ๊ท€ ๋ถ„์„์˜ ๋ชฉํ‘œ์™€ ๋™์ผํ•˜๊ฒŒ ์ข…์† ๋ณ€์ˆ˜์™€ ๋…๋ฆฝ ๋ณ€์ˆ˜๊ฐ„์˜ ๊ด€๊ณ„๋ฅผ ๊ตฌ์ฒด์ ์ธ ํ•จ์ˆ˜๋กœ ๋‚˜ํƒ€๋‚ธ๋‹ค. ๋…๋ฆฝ ๋ณ€์ˆ˜์˜ ์„ ํ˜• ๊ฒฐํ•ฉ์œผ๋กœ ์ข…์† ๋ณ€์ˆ˜๋ฅผ ์„ค๋ช…ํ•œ๋‹ค๋Š” ๊ด€์ ์—์„œ ์„ ํ˜• ํšŒ๊ท€ ๋ถ„์„๊ณผ ์œ ์‚ฌํ•˜๋‚˜ ์„ ํ˜• ํšŒ๊ท€ ๋ถ„์„๊ณผ ๋‹ฌ๋ฆฌ ์ข…์† ๋ณ€์ˆ˜๊ฐ€ ๋ฒ”์ฃผํ˜• ๋ฐ์ดํ„ฐ์ด๊ณ  ์ž…๋ ฅ ๋ฐ์ดํ„ฐ๊ฐ€ ์ฃผ์–ด์กŒ์„ ๋•Œ ํ•ด๋‹น ๋ฐ์ดํ„ฐ์˜ ๊ฒฐ๊ณผ๊ฐ€ ํŠน์ • ๋ถ„๋ฅ˜๋กœ ๋‚˜๋‰˜๊ธฐ ๋•Œ๋ฌธ์— ์ผ์ข…์˜ ๋ถ„๋ฅ˜(classification) ๊ธฐ๋ฒ•์œผ๋กœ๋„ ๋ณผ ์ˆ˜๋„ ์žˆ๋‹ค.



Sigmoid Function

๊ทธ๋ฆผ์„ ๋ณด๋ฉด ์„ ํ˜•ํšŒ๊ท€ ๋ฐฉ์‹์œผ๋กœ๋Š” ๋ฐ์ดํ„ฐ์— ๋”ฐ๋ฅธ ๊ฒฐ๊ณผ๋ฅผ ์ •ํ™•ํžˆ ์˜ˆ์ธกํ•˜๊ธฐ ํž˜๋“ค๋‹ค. ๋”ฐ๋ผ์„œ Sigmoid function์„ ์ด์šฉํ•ด hypothesis๋ฅผ ์ˆ˜์ •ํ•ด์ค€๋‹ค. sigmoid function์€ ์‰ฝ๊ฒŒ ๋งํ•ด hypothesis์˜ ๋ฒ”์œ„๋ฅผ 0๊ณผ 1 ์‚ฌ์ด๋กœ ์••์ถ•ํ•ด์ค€๋‹ค. ํ•จ์ˆ˜๋Š” ๋‹ค์Œ๊ณผ ๊ฐ™๋‹ค.
g(z)=ezez+1=11+eโˆ’z
์ด๋•Œ z=WX ์ฆ‰, hypothesis๋ฅผ ์˜๋ฏธํ•œ๋‹ค.

Hypothesis

sigmoid function์„ ์ด์šฉํ•œ hypothesis๋Š” ๋‹ค์Œ๊ณผ ๊ฐ™๋‹ค.
H(X)=11+eโˆ’WTX

Cost Function

์ด์ œ Cost function์„ ๊ตฌํ•˜๋ฉด cost(W)=1mฮฃ(H(X)โˆ’y)2์ด ๋˜๊ณ , ํ•จ์ˆ˜๋ฅผ ๊ทธ๋ฆฌ๋ฉด ์•„๋ž˜์™€ ๊ฐ™๋‹ค.



๊ทธ๋ž˜ํ”„์˜ ๊ฐœํ˜•์„ ๋ณด๋ฉด convex function์ด ์•„๋‹ˆ๋ผ๋Š” ๊ฒƒ์„ ์•Œ ์ˆ˜ ์žˆ๋‹ค. ์ด cost function์„ ์ด์šฉํ–ˆ์„ ๋•Œ local minimum๊ณผ global minimum์ด ๊ฐ™์ง€ ์•Š์•„ ์ž˜๋ชป๋œ ๊ฐ’์„ ์ถ”์ •ํ•  ์ˆ˜ ์žˆ์œผ๋ฏ€๋กœ ๋‹ค๋ฅธ cost function์„ ์‚ฌ์šฉํ•ด์•ผํ•  ๊ฒƒ์ด๋‹ค. ๊ฒฐ๊ณผ์ ์œผ๋กœ ์•„๋ž˜์™€ ๊ฐ™์€ ์ˆ˜์‹์œผ๋กœ ํ‘œํ˜„๋œ๋‹ค.
cost(W)=1mฮฃc(H(x),y)
์ด๋•Œ c ํ•จ์ˆ˜๋Š” ์•„๋ž˜์™€ ๊ฐ™๋‹ค.
c(H(x),y)=โˆ’log(H(x)):y=1
c(H(x),y)=โˆ’log(1โˆ’H(x)):y=0
ํ•จ์ˆ˜๋ฅผ ๊ทธ๋ฆฌ๋ฉด ์•„๋ž˜ ๊ทธ๋ฆผ๊ณผ ๊ฐ™๊ฒŒ ๋˜๋Š”๋ฐ ๊ทธ๋ž˜ํ”„๋ฅผ ๋ณด๋ฉด convex function์ž„์„ ์•Œ ์ˆ˜ ์žˆ๋‹ค.



ํ•จ์ˆ˜๋ฅผ ๊ฐ„์†Œํ™” ํ•˜๋ฉด c(H(x),y)=โˆ’ylog(H(x))โˆ’(1โˆ’y)log(1โˆ’H(x))์ด ๋˜๊ณ  ์ด ํ•จ์ˆ˜๋Š” convex function์ด๋ฏ€๋กœ cost function์— ์ ์šฉํ•˜๋ฉด
cost(W) = -\cfrac{1}{m}\Sigma \big{ ylog(H(x)) - (1-y)log(1-H(x))\big}
์œ„์™€ ๊ฐ™์€ ์‹์œผ๋กœ ํ‘œํ˜„๋œ๋‹ค.

์ด์ œ cost function์„ ํ†ตํ•ด minimized W๋ฅผ ๊ตฌํ•  ์ˆ˜ ์žˆ๊ฒŒ ๋œ๋‹ค. cost function๊ณผ ํŽธ๋ฏธ๋ถ„์„ ํ†ตํ•ด W๋ฅผ ์กฐ์ •ํ•  ์ˆ˜ ์žˆ๋Š”๋ฐ ์‹์€ ๋‹ค์Œ๊ณผ ๊ฐ™๋‹ค.
W:=Wโˆ’ฮฑโˆ‚โˆ‚xcost(W)


ํ…์„œํ”Œ๋กœ์šฐ ๋“ฑ์—์„œ minimizeํ•˜๋Š” ๋ฉ”์†Œ๋“œ๋ฅผ ์ œ๊ณตํ•˜๋ฏ€๋กœ ์ง์ ‘ ๊ณ„์‚ฐํ•  ํ•„์š”๋Š” ์—†๋‹ค.

'AI & ML' ์นดํ…Œ๊ณ ๋ฆฌ์˜ ๋‹ค๋ฅธ ๊ธ€