π‘ Linear Regression
Linear Regression, μ ννκ·λ Supervised learning(μ§λνμ΅) λ°©λ² μ€ νλλ‘ λ°μ΄ν°λ₯Ό κ°μ₯ μ λλ³νλ νλμ μ§μ μ μ°Ύλ μκ³ λ¦¬μ¦μ΄λ€.
μμμ dataμ λν μ ν νκ· κ²°κ³Όλ₯Ό 보μ. μλ κ·Έλ¦Όμμ μ λ€μ data, νλ μ§μ μ dataλ€μ κ°μ₯ μ νννλ μ§μ μ΄λΌκ³ ν μ μλ€.
μ΄μ²λΌ μ ννκ·λ $x$μ $y$μ κ΄κ³λ₯Ό 보μ¬μ£Όλ κ²μΌλ‘ $x$λ λ
립 λ³μ, $y$λ₯Ό μ’
μ λ³μλΌκ³ νλ€.
Hypothesis
μ ννκ·λ₯Ό ν΅ν΄ μ§μ μ μ μΆν΄λ΄κΈ° μν΄ μΈμ°λ μμ Hypothesis, κ°μ€μ΄λΌκ³ νλ€.
κ°μ€μ $H(x) = W(x) + b$μ ννμ΄λ©°, μ΄λ $W$λ Weight(κ°μ€μΉ), $b$λ bias(νΈν₯)μ΄λ€.
Cost Function
μ ννκ·μμ λͺ¨λΈκ³Ό μ€μ λ°μ΄ν° κ°μ μ°¨μ΄λ₯Ό μΈ‘μ νκΈ° μν΄ Cost function(λΉμ©ν¨μ)λ₯Ό μ¬μ©νλ€. λΉμ©ν¨μλ μ΅μμ κ³±λ²μ μ¬μ©νλλ° λ€μκ³Ό κ°μ μμ μ¬μ©νλ€.
$$cost(W,b) = \frac{1}{m}\Sigma^{m}_{i=1}(H(x_i)-y_i)^2$$
μμμ 보면 λΉμ©ν¨μλ error μ κ³±μ νκ· κ°μμ μ μ μλ€. μ΄ costλ₯Ό μ΅μννλ λ°©ν₯μΌλ‘ Hypothesisλ₯Ό μ‘°μ νκ² λκ³ training dataλ₯Ό fittingνλ μ΄ κ³Όμ μ΄ learningμΈ κ²μ΄λ€.
Gradient Descent
μ ννκ·μμμ κ²½μ¬ νκ°λ²μ μ½κ² λ§ν΄ cost functionμ κΈ°μΈκΈ° ν¬κΈ°(μ λκ°)μ΄ μμμ§λ λ°©ν₯μΌλ‘ Hypothesisλ₯Ό μ‘°μ νλ κ²μ΄λ€. μ¦ costκ° μμμ§λ λ°©ν₯μΌλ‘ $Weight$μ $bias$λ₯Ό μ‘°μ νλ κ²μ΄λ€.
κ²½μ¬ νκ°λ²μ λμμ΄ Convex FunctionμΈ κ²½μ° μ νν κ°μ λμΆν΄λΌ μ μλ€. Convex functionμ local minimumκ³Ό global minimum κ°μ functionμ΄κ³ cost functionμ κ²½μ° μ΄μ°¨ 곑면μ΄κΈ°μ Convex functionμ ν΄λΉνλ€.
λ§μ½ Convex functionμ ν΄λΉνμ§ μμ κ²½μ° κ²½μ¬ νκ°λ² νΉμ±μ μμμ μμΉμμ μμνκΈ° λλ¬Έμ local minimunμ λ°ννλ κ²°κ³Όλ₯Ό λ³μ μ μλ€. μλ κ·Έλ¦Όμ²λΌ local minimumμ΄ global minimumκ³Ό μΌμΉνμ§ μμ μ μκΈ° λλ¬Έμ costκ° μ΅μλΌλ 보μ₯μ΄ μλ κ²μ΄λ€.
$Weight$κ°μ μ‘°μ νλ μμ λ€μκ³Ό κ°λ€.
$$W := W - \alpha\frac{1}{m}\Sigma^m_{i=1}(W(x_i)-y_i)^2$$
μ ννκ·λ λ
립 λ³μμ μμ λ°λΌ Simple Linear Regression(λ¨μ μ ννκ·)κ³Ό Multi-variable Linear Regression(λ€μ€ μ ννκ·)μΌλ‘ λλλ€.
Simple Linear Regression
λ¨μ μ ννκ·λ λ
립 λ³μ $x$κ° νλμΈ μ ννκ·λ‘ μμ μ€λͺ
ν Hypothesisμ Cost functionμ κ°λλ€.
Multi-variable Linear Regression
λ€μ€ μ ννκ·λ λ
립 λ³μκ° μ¬λ¬κ°μΈ μ ννκ·λ‘ Hypothesis κ³μ°μ μν΄ Matrixλ₯Ό μ¬μ©νλ€.
$$H(X) = XW + b$$
μ΄λ $XW$λ‘ νννλ μ΄μ λ λ
립 λ³μμ weightλ₯Ό νλ ¬κ³±μΌλ‘ νννκΈ° μν¨μ΄λ€. μλ₯Ό λ€μ΄ μλμ κ°μ΄ 3κ°μ λ
립 λ³μλ₯Ό κ°μ§κ³ κ·Έμ λν λ°μ΄ν°κ° 5κ° μ£Όμ΄μ§ κ²½μ° νλ ¬κ³±μΌλ‘ νννλ©΄ μ½κ² κ³μ°μ΄ κ°λ₯νκ² λλ€.
'AI & ML' μΉ΄ν κ³ λ¦¬μ λ€λ₯Έ κΈ
[DL] RNN, Recursive Neural Network (0) | 2024.02.25 |
---|---|
[DL] CNN, Convolution Neural Network (0) | 2024.02.24 |
[ML] Logistic Rrgression, λ‘μ§μ€ν± νκ· (1) | 2024.01.21 |