๋ณธ๋ฌธ ๋ฐ”๋กœ๊ฐ€๊ธฐ
IT-Engineering/A.I.

์ดˆ์ดˆ๋ณด๋„ ์ดํ•ดํ•˜๋Š” ๋”ฅ๋Ÿฌ๋‹ 5ํƒ„ : ์ถœ๋ ฅ์ธต ์„ค๊ณ„(feat.Softmax)

by ๐Ÿงž‍โ™‚๏ธ 2020. 6. 2.
๋ฐ˜์‘ํ˜•

2020/03/31 - [IT-Engineering/A.I.] - ์ดˆ์ดˆ๋ณด๋„ ์ดํ•ดํ•˜๋Š” ๋”ฅ๋Ÿฌ๋‹ 1ํƒ„ : ์ธ๊ณต์ง€๋Šฅ, ๋จธ์‹ ๋Ÿฌ๋‹, ๋”ฅ๋Ÿฌ๋‹

2020/03/31 - [IT-Engineering/A.I.] - ์ดˆ์ดˆ๋ณด๋„ ์ดํ•ดํ•˜๋Š” ๋”ฅ๋Ÿฌ๋‹ 2ํƒ„ : ํผ์…‰ํŠธ๋ก (Perceptron)

2020/04/03 - [IT-Engineering/A.I.] - ์ดˆ์ดˆ๋ณด๋„ ์ดํ•ดํ•˜๋Š” ๋”ฅ๋Ÿฌ๋‹ 3ํƒ„ : ์‹ ๊ฒฝ๋ง, ํ™œ์„ฑํ™” ํ•จ์ˆ˜

2020/05/16 - [IT-Engineering/A.I.] - ์ดˆ์ดˆ๋ณด๋„ ์ดํ•ดํ•˜๋Š” ๋”ฅ๋Ÿฌ๋‹ 4ํƒ„ : ํ™œ์„ฑํ™” ํ•จ์ˆ˜(activation function)

 

 

์ด์ „์— ๊ฐ„๋‹จํ•˜๊ฒŒ ๊ฐœ๋… ์ •๋ฆฌํ•œ ๊ธ€์„ ์‚ดํŽด๋ณด๋ ค๊ฑฐ๋“  ์œ„์˜ ๊ธ€์„ ์ฝ์–ด๋ณด๊ธฐ๋ฅผ ๋ฐ”๋ž€๋‹ค.

 

์ด๋ฒˆ์—” 5ํƒ„, ์ถœ๋ ฅ์ธต ์„ค๊ณ„์— ๋Œ€ํ•ด์„œ ์ดˆ๋ณด๋ณด๋‹ค ๋‚ฎ์€ ์ดˆ์ดˆ๋ณด์ ์ธ ์ˆ˜์ค€์—์„œ ์•Œ์•„๋ณด๊ฒ ๋‹ค.

 

1ํƒ„์—์„œ ๊ธฐ๊ณ„ํ•™์Šต(๋จธ์‹ ๋Ÿฌ๋‹) ์•ˆ์— ์‹ฌ์ธตํ•™์Šต(๋”ฅ๋Ÿฌ๋‹)์ด ๋“ค์–ด๊ฐ€๋Š” ๊ฒƒ์„ ํ™•์ธํ–ˆ์—ˆ๋Š”๋ฐ,

๊ธฐ๊ณ„ํ•™์Šต์€ ํฌ๊ฒŒ ๋‹ค์Œ์˜ ์„ธ๋ถ€๋ฅ˜๋กœ ๋ถ„๋ฅ˜๋ฅผ ํ•˜๊ณคํ•œ๋‹ค.

1. Supervised Learning(์ง€๋„ ํ•™์Šต)

2. Unsupervised Learning(๋น„์ง€๋„ ํ•™์Šต)

3. Reinforcement Learning(๊ฐ•ํ™” ํ•™์Šต)

 

์ด ์ค‘ ์ง€๋„ํ•™์Šต์€ ํฌ๊ฒŒ 

1-1. Classification(๋ถ„๋ฅ˜)

1-2. Regression(ํšŒ๊ท€)

 

๋กœ ๋‚˜๋‰˜๊ฒŒ ๋œ๋‹ค.

 

๋ถ„๋ฅ˜๋ฌธ์ œ๋Š” MNIST์†๊ธ€์”จ ๋ฌธ์ œ์™€ ๊ฐ™์ด, ์†๊ธ€์”จ๋ฅผ ๋ณด๊ณ  ์ˆซ์ž๊ฐ€ 0~9๊นŒ์ง€ ์–ด๋–ค ์ˆซ์ž์ธ์ง€ ๋งž์ถ”๋Š” ๋ฌธ์ œ ๋“ฑ์ด ์žˆ๊ณ ,

ํšŒ๊ท€๋ฌธ์ œ๋Š” ์‚ฌ์ง„ ์† ์ธ๋ฌผ์˜ ๋ชธ๋ฌด๊ฒŒ๊ฐ€ ๋ช‡ํ‚ฌ๋กœ๊ทธ๋žจ์ผ๊นŒ๋ฅผ ๋งž์ถ”๋Š” ๋ฌธ์ œ ๋“ฑ์ด ์žˆ์„ ๊ฒƒ์ด๋‹ค.

์‹ ๊ฒฝ๋ง(Neural network)์˜ ๊ตฌ์กฐ(์ถœ์ฒ˜: Wikimedia Commons)

์ด๋ฒˆ ์ถœ๋ ฅ์ธต ์„ค๊ณ„๋Š” 3ํƒ„์—์„œ ๋‹ค๋ฃจ์—ˆ๋˜ ์ตœ์ข… ์ธต์ธ ์ถœ๋ ฅ์ธต์— ๋Œ€ํ•œ ์„ค๊ณ„ ๋‚ด์šฉ์ด๋‹ค.

3ํƒ„์˜ ์‹ ๊ฒฝ๋ง(๋‹ค์ธต ํผ์…‰ํŠธ๋ก )์—์„œ ์ถœ๋ ฅ์ธต(output layer)๋ฅผ ํ†ตํ•ด output์ด ๋‚˜์˜ค๋Š” ๊ฒƒ์„ ํ™•์ธํ•  ์ˆ˜ ์žˆ๋Š”๋ฐ,

์ด๋•Œ ์ž…๋ ฅ๋œ ๊ฐ’์ด ์ถœ๋ ฅ๊ฐ’์œผ๋กœ ๊ทธ๋Œ€๋กœ ๋‚˜์˜ค๋Š” ๊ฒฝ์šฐ๋„ ์žˆ๊ณ , ๊ทธ๋ ‡์ง€ ์•Š์€ ๊ฒฝ์šฐ๋„ ์žˆ๋‹ค.

 

์œ„์—์„œ ์™œ ๊ธฐ๊ณ„ํ•™์Šต์˜ ๋ถ„๋ฅ˜๋ฅผ ๋‚˜๋ˆ„์—ˆ๋ƒ๋ฉด,

๋ณดํ†ต ํšŒ๊ท€ ๋ฌธ์ œ์—์„œ๋Š” ์ถœ๋ ฅ๊ฐ’์ด ๊ทธ๋Œ€๋กœ ๋‚˜์˜ค๋Š” ํ•ญ๋“ฑํ•จ์ˆ˜(identity function)์„ ์‚ฌ์šฉํ•˜๋Š” ๋ฐ˜๋ฉด,

๋ถ„๋ฅ˜ ๋ฌธ์ œ์—์„œ๋Š” ์ถœ๋ ฅ๊ฐ’์˜ ์ดํ•ฉ์ด 1์ด ๋˜๋Š” ์†Œํ”„ํŠธ๋งฅ์Šค ํ•จ์ˆ˜(softmax function)์„ ์‚ฌ์šฉํ•˜๊ธฐ ๋•Œ๋ฌธ์ด๋‹ค.

 

๋ถ„๋ฅ˜ ๋ฌธ์ œ๋Š” ์˜ˆ์ปจ๋Œ€ ์ด๋ฏธ์ง€๋ฅผ ์ฃผ๊ณ  ๊ฐœ, ๊ณ ์–‘์ด, ์‚ฌ๋žŒ์„ ๋งž์ถ”๋Š” ๋ฌธ์ œ๋ผ๊ณ  ํ–ˆ์„ ๋•Œ,

๊ฐ๊ฐ ๋ฒˆํ˜ธ๋ฅผ ๋ถ™์—ฌ์„œ ๊ฐœ=1, ๊ณ ์–‘์ด=2, ์‚ฌ๋žŒ=3 ์ด๋ผ๊ณ  ํ–ˆ์„ ๋•Œ,

์ตœ์ข… ์ถœ๋ ฅ๊ฐ’์ด \begin{pmatrix}0.7\\ 0.2\\ 0.1\end{pmatrix} ์ด ๋‚˜์™”๋‹ค๊ณ  ํ•˜์ž.

์ด ๋œป์€ ๊ฐœ์ผ ํ™•๋ฅ ์ด 70%, ๊ณ ์–‘์ด์ผ ํ™•๋ฅ ์ด 20%, ์‚ฌ๋žŒ์ผ ํ™•๋ฅ ์ด 10%๋ผ๊ณ  ์˜ˆ์ธกํ–ˆ๋‹ค๋Š” ๋œป์ด๋‹ค.

์ฆ‰, '์ด ์‚ฌ์ง„์€ ์•„๋งˆ๋„ 70% ํ™•๋ฅ ๋กœ ๊ฐœ์ธ ๊ฒƒ ๊ฐ™๋‹ค.' ๋ผ๊ณ  ๊ฒฐ๊ณผ๊ฐ€ ๋‚˜์˜จ ๊ฒƒ์ด๋‹ค.

 

์ด ๋•Œ ์ถœ๋ ฅ๊ฐ’์„ ์ด์™€ ๊ฐ™์€ ํ˜•ํƒœ๋กœ ๋ฐ”๊พธ์–ด์ฃผ๋Š” ํ•จ์ˆ˜๊ฐ€ ๋ฐ”๋กœ ์œ„์—์„œ ๋งํ•œ ์†Œํ”„ํŠธ๋งฅ์Šค ํ•จ์ˆ˜์ด๋‹ค.

์‹์€ ๋‹ค์Œ๊ณผ ๊ฐ™๋‹ค.

\[y_{k}=\frac{e^{a_k}}{\sum_{i=1}^{n}e^{a_i}}\]

์—ฌ๊ธฐ์„œ e๋Š” ์ž์—ฐ์ƒ์ˆ˜, n์€ ์ถœ๋ ฅ์ธต์˜ ๋‰ด๋Ÿฐ ์ˆ˜, \(y_k\)๋Š” k๋ฒˆ ์งธ ์ถœ๋ ฅ์„ ๋งํ•œ๋‹ค.

๋ฐ˜์‘ํ˜•

๋Œ“๊ธ€