Welcome! ๐Ÿ™‹โ€โ™‚๏ธ View more

AI

MLOps Engineer๊ฐ€ ๋ณด๋Š” ๋”ฅ์‹œํฌ(DeepSeek)์— ๋Œ€ํ•œ ์ƒ๊ฐ

DeepFlame 2025. 2. 1. 20:05

๋”ฅ์‹œํฌ(DeepSeek)๋Š” 2023๋…„์— ์„ค๋ฆฝ๋œ ์ค‘๊ตญ์˜ ์ธ๊ณต์ง€๋Šฅ(AI) ๊ธฐ์—…์œผ๋กœ, ๋Œ€๊ทœ๋ชจ ์–ธ์–ด ๋ชจ๋ธ(LLM)์„ ๊ฐœ๋ฐœํ•˜๊ณ  ์žˆ์Šต๋‹ˆ๋‹ค.
2025๋…„ 1์›” 10์ผ, DeepSeek๋Š” DeepSeek-R1 ๋ชจ๋ธ์„ ๊ธฐ๋ฐ˜์œผ๋กœ ํ•œ ๋ฌด๋ฃŒ AI ์–ด์‹œ์Šคํ„ดํŠธ ์•ฑ์„ iOS์™€ ์•ˆ๋“œ๋กœ์ด๋“œ์šฉ์œผ๋กœ ์ถœ์‹œํ•˜์˜€์œผ๋ฉฐ, ์ด ์•ฑ์€ ๋ฏธ๊ตญ iOS ์•ฑ ์Šคํ† ์–ด์—์„œ ChatGPT๋ฅผ ์ œ์น˜๊ณ  ์ธ๊ธฐ์ฐจํŠธ 1์ˆœ์œ„์— ์˜ฌ๋ž์Šต๋‹ˆ๋‹ค. ๊ทธ๋งŒํผ ํ˜„์žฌ ๋ฐ˜์‘์ด ๋œจ๊ฒ์Šต๋‹ˆ๋‹ค.

 

 

์™œ ์ด๋ ‡๊ฒŒ ๋‚œ๋ฆฌ์ผ๊นŒ?

๋”ฅ์‹œํฌ๋Š” ์ €๋น„์šฉ์˜ AI ์†”๋ฃจ์…˜์„ ์ œ๊ณตํ•จ์œผ๋กœ์จ, ๊ธฐ์กด์˜ AI ์‹œ์žฅ ๊ตฌ์กฐ๋ฅผ ๋ณ€ํ™”์‹œํ‚ค๊ณ  ์žˆ์Šต๋‹ˆ๋‹ค.
ํŠนํžˆ ๋ฏธ๊ตญ์˜ ๋Œ€ํ˜• AI ๊ธฐ์—…๋“ค์—๊ฒŒ ๋„์ „์žฅ์„ ๋‚ด๋ฐ€๋ฉฐ, ๊ธ€๋กœ๋ฒŒ AI ์‹œ์žฅ์—์„œ ์ค‘์š”ํ•œ ์—ญํ• ์„ ํ•˜๊ณ  ์žˆ์Šต๋‹ˆ๋‹ค.

๋”ฅ์‹œํฌ๋Š” ๋น„์šฉ ํšจ์œจ์„ฑ๊ณผ ์˜คํ”ˆ ์†Œ์Šค ๋ชจ๋ธ์„ ํ†ตํ•ด AI ๊ธฐ์ˆ ์˜ ์ ‘๊ทผ์„ฑ์„ ๋†’์—ฌ, ๋‹ค์–‘ํ•œ ๊ธฐ์—…๊ณผ ์—ฐ๊ตฌ์ž๋“ค์—๊ฒŒ ์œ ์šฉํ•œ ๋„๊ตฌ๋กœ ์ž๋ฆฌ์žก๊ณ  ์žˆ์Šต๋‹ˆ๋‹ค.

ํŠนํžˆ Chat GPT์™€ ๋น„๊ต๋ฅผ ํ•˜๊ณ  ์žˆ๋Š”๋ฐ, Chat GPT๋Š” ์• ์ดˆ์— ๋ชจ๋ธ์„ ํฌ๊ฒŒ ๋งŒ๋“ค์–ด ์„ฑ๋Šฅ์„ ์ข‹๊ฒŒ ๋งŒ๋“œ๋Š” ์ „๋žต์„ ํŽผ์ณ์™”์Šต๋‹ˆ๋‹ค.

์ถœ์ฒ˜: https://newsletter.victordibia.com/p/understanding-size-tradeoffs-with

์ด ๋ง๋„ ์•ˆ ๋˜๋Š” ์‚ฌ์ด์ฆˆ์˜ ๋ชจ๋ธ์„ ํ›ˆ๋ จํ•˜๊ธฐ ์œ„ํ•ด์„œ ๊ทธ ๋™์•ˆ GPU๊ฐ€ ๋งŽ์ด ํ•„์š”ํ•  ์ˆ˜ ๋ฐ–์— ์—†์—ˆ์Šต๋‹ˆ๋‹ค.
Open AI๋Š” ์ด๋Œ€๋กœ ๊ณ„์† ๊ฐ€๋ฉด ๊ฐ€์žฅ ์ธ๊ฐ„์— ๊ฐ€๊นŒ์šด ๋ชจ๋ธ์ด ํƒ„์ƒํ•  ๊ฒƒ์ด๋ผ๊ณ  ์ƒ๊ฐํ–ˆ์„ ๊ฒƒ์ž…๋‹ˆ๋‹ค.

ํ•˜์ง€๋งŒ ๋”ฅ์‹œํฌ๋Š” ๊ธฐ์กด์˜ ๋Œ€๊ทœ๋ชจ ์ปดํ“จํŒ… ํŒŒ์›Œ์— ์˜์กดํ•˜๋Š” ์ ‘๊ทผ ๋ฐฉ์‹์— ๋„์ „์žฅ์„ ๋‚ด๋ฐ€๊ณ  ์žˆ์Šต๋‹ˆ๋‹ค.

 

์–ผ๋งˆ๋‚˜ ๋ฆฌ์†Œ์Šค๋ฅผ ์ ๊ฒŒ ์“ธ๊นŒ์š”?

๋”ฅ์‹œํฌ(DeepSeek)๋Š” ChatGPT์™€ ๋น„๊ตํ–ˆ์„ ๋•Œ ์ƒ๋‹นํžˆ ์ ์€ ๋ฆฌ์†Œ์Šค๋ฅผ ์‚ฌ์šฉํ•˜๋Š” ๊ฒƒ์œผ๋กœ ์•Œ๋ ค์ ธ ์žˆ์Šต๋‹ˆ๋‹ค.

๋”ฅ์‹œํฌ๋Š” ์•ฝ 2,000๊ฐœ์˜ ์นฉ์„ ์‚ฌ์šฉํ•˜๋Š” ๋ฐ˜๋ฉด, ChatGPT๋Š” 16,000๊ฐœ ์ด์ƒ์˜ ์นฉ์„ ์‚ฌ์šฉํ•ฉ๋‹ˆ๋‹ค.
์ด๋Š” ๋”ฅ์‹œํฌ๊ฐ€ ChatGPT์— ๋น„ํ•ด ์•ฝ 87.5% ์ ์€ ํ•˜๋“œ์›จ์–ด ๋ฆฌ์†Œ์Šค๋ฅผ ์‚ฌ์šฉํ•œ๋‹ค๋Š” ๊ฒƒ์„ ์˜๋ฏธํ•ฉ๋‹ˆ๋‹ค.

๋ฆฌ์†Œ์Šค๊ฐ€ ์ ๊ฒŒ ์‚ฌ์šฉ๋˜๋‹ค ๋ณด๋‹ˆ, OpenAI๊ฐ€ ๋ชจ๋ธ ํ›ˆ๋ จ์— ์ˆ˜์ฒœ๋งŒ ๋‹ฌ๋Ÿฌ๋ฅผ ํˆฌ์žํ•œ ๊ฒƒ๊ณผ ๋‹ฌ๋ฆฌ ๋”ฅ์‹œํฌ๋Š” ๋‹จ 550๋งŒ ๋‹ฌ๋Ÿฌ๋กœ AI ๋ชจ๋ธ์„ ๊ฐœ๋ฐœํ–ˆ๋‹ค๊ณ  ์ฃผ์žฅํ•˜๊ณ  ์žˆ์Šต๋‹ˆ๋‹ค.

 

๊ทธ๋Ÿฐ๋ฐ ์„ฑ๋Šฅ์ด ๋น„์Šทํ•ด?

๋”ฅ์‹œํฌ DeepSeek์—์„œ ์ œ๊ณตํ•˜๋Š” ์ž๋ฃŒ์— ๋”ฐ๋ฅด๋ฉด OpenAI-o1-1217๊ณผ ๋น„์Šทํ•œ ์„ฑ๋Šฅ์„ ๋‚ด๋Š” ๊ฒƒ์œผ๋กœ ๋ณด์—ฌ์ง‘๋‹ˆ๋‹ค. 
OpenAI๋Š” ๋ชจ๋ธ ์‚ฌ์ด์ฆˆ๋ฅผ ๊ณต๊ฐœํ•˜์ง€ ์•Š๋Š” ์ •์ฑ…์„ ๊ฐ€์ง€๊ธฐ ๋•Œ๋ฌธ์— ์ •ํ™•ํ•œ ๋ชจ๋ธ ์‚ฌ์ด์ฆˆ๋ฅผ ์•Œ ์ˆ˜๋Š” ์—†์ง€๋งŒ, DeepSeek-R1์˜ ์‚ฌ์ด์ฆˆ๊ฐ€ ํ›จ์”ฌ ์ ์€ ๊ฒƒ์œผ๋กœ ์•Œ๋ ค์ ธ ์žˆ์Šต๋‹ˆ๋‹ค.

์ถœ์ฒ˜: https://github.com/deepseek-ai/DeepSeek-R1?tab=readme-ov-file#usage-recommendations

 

ํ•œ ์ž๋ฃŒ์—์„œ ๋ณด๋ฉด ๋ฆฌ์†Œ์Šค ๋Œ€๋น„ ์„ฑ๋Šฅ์ด ์••๋„์ ์œผ๋กœ ๋†’์€ ๊ฒƒ์œผ๋กœ ์•Œ ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.

์ถœ์ฒ˜: https://blog.chathub.gg/is-deepseek-v3-better-than-chatgpt-4o-a-comprehensive-guide/

 

์–ด๋–ป๊ฒŒ ํ–ˆ์„๊นŒ?

๋”ฅ์‹œํฌ๋Š” ํ˜์‹ ์ ์ธ ์•„ํ‚คํ…์ฒ˜๋ฅผ ์ œ์‹œํ–ˆ์Šต๋‹ˆ๋‹ค.
์ „์ฒด์ ์œผ๋กœ ์ €๋น„์šฉ์œผ๋กœ ํ•™์Šต์„ ํ•˜๊ธฐ ์œ„ํ•ด์„œ ์—ฐ๊ตฌ๋ฅผ ํ–ˆ๋˜ ๋…ธ๋ ฅ์ด ๋А๊ปด์ง‘๋‹ˆ๋‹ค.

  • Mixture of Experts (MoE)
    • 671์–ต ๊ฐœ์˜ ์ด ํŒŒ๋ผ๋ฏธํ„ฐ ์ค‘ ๊ฐ ์ž‘์—…๋งˆ๋‹ค 37์–ต ๊ฐœ๋งŒ ํ™œ์„ฑํ™”๋ฉ๋‹ˆ๋‹ค. ์ด๋ฅผ ํ†ตํ•ด์„œ ๋Œ€๊ทœ๋ชจ ๋ชจ๋ธ ์„ฑ์„ ์œ ์ง€ํ•˜๋ฉด์„œ ๊ณ„์‚ฐ ๋น„์šฉ์„ ์ ˆ๊ฐํ–ˆ์Šต๋‹ˆ๋‹ค.
  • Multi-Head Latent Attention (MLA)
    • ํ‚ค-๊ฐ’(KV) ๋ฒกํ„ฐ๋ฅผ ์ €์ฐจ์› ์ž ์žฌ ๊ณต๊ฐ„์œผ๋กœ ์••์ถ•ํ•˜์—ฌ ๋ฉ”๋ชจ๋ฆฌ ์‚ฌ์šฉ๋Ÿ‰์„ ์ค„์ด๊ณ  ์ถ”๋ก  ์†๋„๋ฅผ ๋†’์˜€์Šต๋‹ˆ๋‹ค
  • FP8 ํ˜ผํ•ฉ ์ •๋ฐ€๋„ ํ•™์Šต
    • 8๋น„ํŠธ ๋ถ€๋™์†Œ์ˆ˜์ (FP8) ์ •๋ฐ€๋„๋ฅผ ์‚ฌ์šฉํ•˜์—ฌ GPU ๋ฉ”๋ชจ๋ฆฌ ์‚ฌ์šฉ๋Ÿ‰๊ณผ ๊ณ„์‚ฐ ๋น„์šฉ์„ ์ ˆ๋ฐ˜์œผ๋กœ ์ค„์˜€์Šต๋‹ˆ๋‹ค.
    • ๊ธฐ์กด์—๋Š” FP32(32๋น„ํŠธ ๋ถ€๋™์†Œ์ˆ˜์ )์™€ FP16(16๋น„ํŠธ ๋ถ€๋™์†Œ์ˆ˜์ )์„ ์กฐํ•ฉํ•ด์„œ ์‚ฌ์šฉํ–ˆ์Šต๋‹ˆ๋‹ค.

 

 

์ค‘๊ตญ ๋ชจ๋ธ.. ๋ฏฟ์„๋งŒํ•œ๊ฐ€..?

์‚ฌ์‹ค ์ค‘๊ตญ AI ๊ธฐ์ˆ ์€ ์ด์ „๋ถ€ํ„ฐ ๋‘๊ฐ์„ ๋“œ๋Ÿฌ๋‚ด๊ณ  ์žˆ์—ˆ์Šต๋‹ˆ๋‹ค.
AI ๋ชจ๋ธ ๊ฐœ๋ฐœ์€ ๋ฐ์ดํ„ฐ๊ฐ€ ๊ต‰์žฅํžˆ ์ค‘์š”ํ•œ๋ฐ, ๋‚˜๋ผ ํŠน์„ฑ์ƒ ๋ฐ์ดํ„ฐ๋ฅผ ์‰ฝ๊ฒŒ ์‚ฌ์šฉํ•  ์ˆ˜ ์žˆ๋Š” ๊ตฌ์กฐ๋ผ ์ข‹์€ ๋ชจ๋ธ๋“ค์ด ๋ฐœํ‘œ๋˜๊ณ  ์žˆ์—ˆ์Šต๋‹ˆ๋‹ค.
๊ทธ๋Ÿฐ๋ฐ ๋ฏธ๊ตญ์— ๋น„ํ•ด์„œ๋Š” ๋‘๊ฐ์„ ๋“œ๋Ÿฌ๋‚ด์ง€ ๋ชป ํ–ˆ์ฃ .

๊ทธ ์ด์œ ๋Š” ์•„๋ฌด๋ž˜๋„ ๋ฏธ๊ตญ์—์„œ GPU๋ฅผ ๊ตฌํ•˜๊ธฐ ์–ด๋ ต๊ธฐ ๋•Œ๋ฌธ์ผ ๊ฒƒ์ž…๋‹ˆ๋‹ค.
๋”ฐ๋ผ์„œ ๋”ฅ์‹œํฌ ๊ฐœ๋ฐœ์ง„๋“ค์€ ์–ด๋–ป๊ฒŒ ํ•˜๋ฉด ์ ์€ GPU๋กœ ์ข‹์€ ๋ชจ๋ธ์„ ๋งŒ๋“ค์–ด๋‚ผ ์ˆ˜ ์žˆ์„๊นŒ? ๋ฅผ ๊ณ ๋ฏผํ–ˆ๋˜ ๊ฒƒ ๊ฐ™์Šต๋‹ˆ๋‹ค. 

์ €๋„ ์ค‘๊ตญ์—์„œ ๊ฐœ๋ฐœํ•œ ๋ชจ๋ธ์ด๋‹ค ๋ณด๋‹ˆ, ์˜์‹ฌ๋“ค ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.
๊ทธ๋Ÿฐ๋ฐ ์ด ๋ชจ๋ธ์€ ์˜คํ”ˆ ์†Œ์Šค๋กœ ๊ณต๊ฐœ๋˜์–ด ์žˆ๊ณ , ์–ด๋””์„œ๋‚˜ ๊ฒ€์ฆํ•ด๋ณผ ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.
(๊ทธ๋งŒํผ ์ž์‹ ์ด ์žˆ๋‹ค๋Š” ์˜๋ฏธ์ธ ๊ฒƒ ๊ฐ™์Šต๋‹ˆ๋‹ค.)

https://github.com/deepseek-ai

 

DeepSeek

DeepSeek has 16 repositories available. Follow their code on GitHub.

github.com

 

์ •๋ฆฌ

๋”ฅ์‹œํฌ์˜ ๋“ฑ์žฅ์œผ๋กœ NVIDIA์˜ ์ฃผ๊ฐ€๊ฐ€ ๋งŽ์ด ๋–จ์–ด์กŒ์Šต๋‹ˆ๋‹ค.
์ง€๊ธˆ GPU๊ฐ€ ๋ถ€์กฑํ•ด์„œ ์‚ฌ๊ณ  ์‹ถ์–ด๋„ ๋ชป ์ƒ€๋Š”๋ฐ, ๋”ฅ์‹œํฌ ๋ชจ๋ธ์„ ํ™œ์šฉํ•œ๋‹ค๋ฉด ๊ตฌํ•˜๊ธฐ ์–ด๋ ค์šด GPU๊ฐ€ ๋งŽ์ด ํ•„์š”ํ•˜์ง€ ์•Š๊ธฐ ๋•Œ๋ฌธ์ž…๋‹ˆ๋‹ค.

๊ทธ๋งŒํผ ํ˜„์žฌ ๋”ฅ์‹œํฌ์˜ ์˜ํ–ฅ๋ ฅ์ด ํฐ๋ฐ์š”.
AI ์—…๊ณ„์—์„œ๋Š” ์–ด๋–จ๊นŒ์š”? ์ €๋Š” ๋„ํ™”์„ ์— ๋ถˆ์„ ๋ถ™์˜€๋‹ค๊ณ  ์ƒ๊ฐํ•ฉ๋‹ˆ๋‹ค.

ํ˜„์žฌ LLM ๋ฐœ์ „์˜ ํ•œ๊ณ„๋Š” ๋งŽ์€ GPU๊ฐ€ ํ•„์š”ํ•˜๋‹ค๋Š” ๊ฒƒ์ด์—ˆ์Šต๋‹ˆ๋‹ค. ๋”ฐ๋ผ์„œ ๋Œ€๋ถ€๋ถ„์˜ ๋Œ€๊ธฐ์—…์—์„œ๋งŒ LLM ์„œ๋น„์Šค๋ฅผ ํ•  ์ˆ˜ ์žˆ์—ˆ๋Š”๋ฐ์š”.
์ด์ œ๋Š” ์Šคํƒ€ํŠธ์—…์—์„œ๋„ ์–ผ๋งˆ๋“ ์ง€ ๋„์ „ํ•  ์ˆ˜ ์žˆ์„ ๊ฒƒ์œผ๋กœ ๋ณด์ž…๋‹ˆ๋‹ค.

๋˜ํ•œ ๋ฏธ๊ตญ์ด ์ง€๊ธˆ ์ž์กด์‹ฌ์ด ๋งŽ์ด ์ƒํ•ด์žˆ๋Š” ์ƒํƒœ์ผํ…๋ฐ์š”. ^^ 
์•ž์œผ๋กœ ๋ฏธ๊ตญ์˜ ํ–‰๋ณด๊ฐ€, ๊ทธ๋ฆฌ๊ณ  ์•ž์œผ๋กœ์˜ AI์˜ ๋ฐœ์ „ ์†๋„๊ฐ€ ๊ถ๊ธˆํ•ฉ๋‹ˆ๋‹ค.