μμ λ₯λ¬λ 3νμ μ΄μ΄ μ΄μ΄λ³΄ λ₯λ¬λ 4νμ΄λ€.
κ²μν΄λ³΄λ©΄ λ₯λ¬λμ λν μλ μ’μ κΈλ€μ΄ λ§μμ,
보λ μ¬λλ€μ μν΄μλ μ€μ€λ‘λ₯Ό μν΄μλ κ°λ¨ν λ΄μ©λ§ μ 리νλ μ°¨μμμ κΈ°λ‘νλ 컨μ μΌλ‘ νλ € νλ€.
3νμμ νΌμ νΈλ‘ κ³Ό μ κ²½λ§μ μ μμ κ΄ν΄ λ€μ μ 맀νκ² ννν λΆλΆμ΄ μλλ°,
μ무λλ μ¬μ©νλ μ¬λλ§λ€ μ½κ°μ μ μμ°¨κ° μμ΄μμΈλ―νλ€.
μμμ νμ±νν¨μλ₯Ό κ³λ¨ν¨μμμ λ€λ₯Έ ν¨μλ‘ λ³κ²½νλ κ²μ΄ μ κ²½λ§κ³Ό λ€μΈ΅νΌμ νΈλ‘ μ μ°¨μ΄λΌκ³ νλλ°,
무리νμ§ μλμ μμ λ€μΈ΅νΌμ νΈλ‘ κ³Ό μ κ²½λ§μ κ°μ μλ―Έλ‘ νλ¨ν΄λ λ λ―νλ©°,
μ΄λ²μλ μ κ²½λ§μ ν΅μ¬μ΄ λλ νμ±νν¨μ(acvitation function)μ λν΄μ μ’ λ μμ보μ.
3νμμλ νμ±νν¨μλ‘ κ³λ¨ν¨μλ₯Ό μμ보μκ³ , μκ·Έλͺ¨μ΄λ ReLUν¨μλ μ΄λ¦λ§ μκ°νλ€.
μ°μ νμ±νν¨μλΌλ κ²μ μ λ ₯ μ νΈμ μ΄ν©μ μΆλ ₯ μ νΈλ‘ λ³νν΄μ£Όλ ν¨μλ₯Ό λ§νλ€.
κ·Έλ¦¬κ³ μ κ²½λ§μμ μ΄ νμ±ν ν¨μκ° μ€μν μ΄μ λ
νμ±ν ν¨μμ λΉμ νμ±(non-linear)μ΄ μ κ²½λ§μ μλ μΈ΅(layer)λ€μ μ‘΄μ¬μ΄μ κ° λλ€.
νμ±ν ν¨μμμ΄ μ€μ²©λ μΈ΅λ€μ κ²°κ΅ κ°μ€μΉ(weight)λ€μ κ³±κ³Ό νΈν₯(bias)λ€μ ν©μ μ‘°ν©μΌλ‘λ§ μ΄λ£¨μ΄μ§λλ°,
μλ₯Όλ€μ΄ νμ±ν ν¨μ h(x) = cxλ₯Ό μ¬μ©νλ€κ³ κ°μ νκ³ λλ² μ€μ²©νλ€κ³ νμ λ, y(x)=h(h(x))μ κ°μ μμ΄ λλλ°,
κ²°κ΅ y(x) = c*c*xμ²λΌ λ ν λ λ€μ λνλ΄λ©΄ y(x) = Dxμ κ°μ μμ΄λ κ²°κ΅ ννμ λ³νκ° μμΌλ,
μ¬λ¬μΈ΅μ μ€μ²©νλ μ΄μ μ μ΄λ¦΄ μ κ° μλ€.
μ΄λ° μ΄μ λ‘ μμ£Ό μ¬μ©λλ ν¨μκ° λκ° μμΌλ
μκ·Έλͺ¨μ΄λ(sigmoid)ν¨μμ
λ 루(ReLU)ν¨μμ΄λ€.
μκ·Έλͺ¨μ΄λ ν¨μμ μμμ λ€μκ³Ό κ°λ€.
$h(x)=\frac{1}{1+\exp(-x)}$
μκΉμλ λ€μκ³Ό κ°λ€.
μ κ΄μ°°ν΄λ³΄λ©΄, κ³λ¨ν¨μμ μ μ¬ν κ²½ν₯μ 보μΈλ€.
inputμ΄ λμμ§μλ‘ 1μ κ°κΉμμ§κ³ , μμμ§μλ‘ 0μ κ°κΉμμ§λ λ§μ΄λ€.
ReLU(Rectified Linear Unit)ν¨μλ μ½κ² λνλ΄λ©΄ νλ‘κ·Έλλ°ν λ λ±μ₯νλ maxν¨μλ₯Ό μ΄μ©ν max(x,0)κ³Ό κ°λ€.
0λ³΄λ€ ν° κ°μ κ·Έλλ‘ μΆλ ₯ν΄μ£Όκ³ , κ·Έ μ΄νμ κ°μ μλμ
μΉλ€λ κ²μ΄λ€.
μμμΌλ‘λ μλμ κ°μ΄ μΈ μ μλ€.
$h(x)=\left\{\begin{matrix}
x(x>0)
\\
0(x\leq0)
\end{matrix}\right.$
μ κ²½λ§μ μ λ ₯μμ (-)κ°μ λκ° μ μλ―Έν ν¨κ³Όκ° μ μΌλ―λ‘ λ¬΄μνκ² λ€λ λ»μ΄ λ΄ν¬λλ€.
μ΄λ¬ν κ°κ°μ ν¨μ ν¨κ³Όμ λΉμ νμ±μ΄ λλΆμ΄μ Έμ μλμΈ΅μ κΉμ΄κ° λν΄μ§μλ‘ ν¨κ³Όκ° μ¦νλ μ μλ€.
μ΄ μ¬μν λΉμ νμ±μ΄ 볡μ‘ν μλμΈ΅μ΄ μ€μ νμμ λͺ¨μ¬ν μ μμ μ λμ λͺ¨λΈλ§μ κ°λ₯μΌνλ κ²μ΄λ€.
μ΄ μ λκΉμ§ μ 리νκ³ μ΄λ² μ 리λ λ.
λκΈ