์ด์ ์ ๊ฐ๋จํ๊ฒ ๊ฐ๋ ์ ๋ฆฌํ ๊ธ์ ์ดํด๋ณด๋ ค๊ฑฐ๋ ์์ ๊ธ์ ์ฝ์ด๋ณด๊ธฐ๋ฅผ ๋ฐ๋๋ค.
์ด๋ฒ์ 5ํ, ์ถ๋ ฅ์ธต ์ค๊ณ์ ๋ํด์ ์ด๋ณด๋ณด๋ค ๋ฎ์ ์ด์ด๋ณด์ ์ธ ์์ค์์ ์์๋ณด๊ฒ ๋ค.
1ํ์์ ๊ธฐ๊ณํ์ต(๋จธ์ ๋ฌ๋) ์์ ์ฌ์ธตํ์ต(๋ฅ๋ฌ๋)์ด ๋ค์ด๊ฐ๋ ๊ฒ์ ํ์ธํ์๋๋ฐ,
๊ธฐ๊ณํ์ต์ ํฌ๊ฒ ๋ค์์ ์ธ๋ถ๋ฅ๋ก ๋ถ๋ฅ๋ฅผ ํ๊ณคํ๋ค.
1. Supervised Learning(์ง๋ ํ์ต)
2. Unsupervised Learning(๋น์ง๋ ํ์ต)
3. Reinforcement Learning(๊ฐํ ํ์ต)
์ด ์ค ์ง๋ํ์ต์ ํฌ๊ฒ
1-1. Classification(๋ถ๋ฅ)
1-2. Regression(ํ๊ท)
๋ก ๋๋๊ฒ ๋๋ค.
๋ถ๋ฅ๋ฌธ์ ๋ MNIST์๊ธ์จ ๋ฌธ์ ์ ๊ฐ์ด, ์๊ธ์จ๋ฅผ ๋ณด๊ณ ์ซ์๊ฐ 0~9๊น์ง ์ด๋ค ์ซ์์ธ์ง ๋ง์ถ๋ ๋ฌธ์ ๋ฑ์ด ์๊ณ ,
ํ๊ท๋ฌธ์ ๋ ์ฌ์ง ์ ์ธ๋ฌผ์ ๋ชธ๋ฌด๊ฒ๊ฐ ๋ชํฌ๋ก๊ทธ๋จ์ผ๊น๋ฅผ ๋ง์ถ๋ ๋ฌธ์ ๋ฑ์ด ์์ ๊ฒ์ด๋ค.
์ด๋ฒ ์ถ๋ ฅ์ธต ์ค๊ณ๋ 3ํ์์ ๋ค๋ฃจ์๋ ์ต์ข ์ธต์ธ ์ถ๋ ฅ์ธต์ ๋ํ ์ค๊ณ ๋ด์ฉ์ด๋ค.
3ํ์ ์ ๊ฒฝ๋ง(๋ค์ธต ํผ์ ํธ๋ก )์์ ์ถ๋ ฅ์ธต(output layer)๋ฅผ ํตํด output์ด ๋์ค๋ ๊ฒ์ ํ์ธํ ์ ์๋๋ฐ,
์ด๋ ์ ๋ ฅ๋ ๊ฐ์ด ์ถ๋ ฅ๊ฐ์ผ๋ก ๊ทธ๋๋ก ๋์ค๋ ๊ฒฝ์ฐ๋ ์๊ณ , ๊ทธ๋ ์ง ์์ ๊ฒฝ์ฐ๋ ์๋ค.
์์์ ์ ๊ธฐ๊ณํ์ต์ ๋ถ๋ฅ๋ฅผ ๋๋์๋๋ฉด,
๋ณดํต ํ๊ท ๋ฌธ์ ์์๋ ์ถ๋ ฅ๊ฐ์ด ๊ทธ๋๋ก ๋์ค๋ ํญ๋ฑํจ์(identity function)์ ์ฌ์ฉํ๋ ๋ฐ๋ฉด,
๋ถ๋ฅ ๋ฌธ์ ์์๋ ์ถ๋ ฅ๊ฐ์ ์ดํฉ์ด 1์ด ๋๋ ์ํํธ๋งฅ์ค ํจ์(softmax function)์ ์ฌ์ฉํ๊ธฐ ๋๋ฌธ์ด๋ค.
๋ถ๋ฅ ๋ฌธ์ ๋ ์์ปจ๋ ์ด๋ฏธ์ง๋ฅผ ์ฃผ๊ณ ๊ฐ, ๊ณ ์์ด, ์ฌ๋์ ๋ง์ถ๋ ๋ฌธ์ ๋ผ๊ณ ํ์ ๋,
๊ฐ๊ฐ ๋ฒํธ๋ฅผ ๋ถ์ฌ์ ๊ฐ=1, ๊ณ ์์ด=2, ์ฌ๋=3 ์ด๋ผ๊ณ ํ์ ๋,
์ต์ข ์ถ๋ ฅ๊ฐ์ด \begin{pmatrix}0.7\\ 0.2\\ 0.1\end{pmatrix} ์ด ๋์๋ค๊ณ ํ์.
์ด ๋ป์ ๊ฐ์ผ ํ๋ฅ ์ด 70%, ๊ณ ์์ด์ผ ํ๋ฅ ์ด 20%, ์ฌ๋์ผ ํ๋ฅ ์ด 10%๋ผ๊ณ ์์ธกํ๋ค๋ ๋ป์ด๋ค.
์ฆ, '์ด ์ฌ์ง์ ์๋ง๋ 70% ํ๋ฅ ๋ก ๊ฐ์ธ ๊ฒ ๊ฐ๋ค.' ๋ผ๊ณ ๊ฒฐ๊ณผ๊ฐ ๋์จ ๊ฒ์ด๋ค.
์ด ๋ ์ถ๋ ฅ๊ฐ์ ์ด์ ๊ฐ์ ํํ๋ก ๋ฐ๊พธ์ด์ฃผ๋ ํจ์๊ฐ ๋ฐ๋ก ์์์ ๋งํ ์ํํธ๋งฅ์ค ํจ์์ด๋ค.
์์ ๋ค์๊ณผ ๊ฐ๋ค.
\[y_{k}=\frac{e^{a_k}}{\sum_{i=1}^{n}e^{a_i}}\]
์ฌ๊ธฐ์ e๋ ์์ฐ์์, n์ ์ถ๋ ฅ์ธต์ ๋ด๋ฐ ์, \(y_k\)๋ k๋ฒ ์งธ ์ถ๋ ฅ์ ๋งํ๋ค.
๋๊ธ