๋ชฉ. 8์›” 14th, 2025

์•ˆ๋…•ํ•˜์„ธ์š”, ๊ธฐ์ˆ  ๋ธ”๋กœ๊ฑฐ ์—ฌ๋Ÿฌ๋ถ„! ๐Ÿง 

์ตœ๊ทผ AI ๊ธฐ์ˆ ์˜ ๋ฐœ์ „์€ ์ •๋ง ๋ˆˆ๋ถ€์‹ญ๋‹ˆ๋‹ค. ๊ทธ์ค‘์—์„œ๋„ ๋Œ€๊ทœ๋ชจ ์–ธ์–ด ๋ชจ๋ธ(LLM)์€ ์šฐ๋ฆฌ์˜ ์ผ์ƒ๊ณผ ์—…๋ฌด ๋ฐฉ์‹์„ ํ˜์‹ ํ•˜๊ณ  ์žˆ์ฃ . ํ•˜์ง€๋งŒ ๋ง‰์ƒ LLM์„ ๋‚ด ์ปดํ“จํ„ฐ์—์„œ ์ง์ ‘ ๋Œ๋ ค๋ณด๋ ค ํ•˜๋ฉด, “GPU๊ฐ€ ๋„ˆ๋ฌด ์•ฝํ•ด์š”…”, “RAM ๋ถ€์กฑ ๋ฉ”์‹œ์ง€๊ฐ€ ๋– ์š”…” ๊ฐ™์€ ๋ฌธ์ œ์— ๋ถ€๋”ชํžˆ๊ธฐ ์ผ์‘ค์ž…๋‹ˆ๋‹ค. ๊ณ ๊ฐ€์˜ ๊ทธ๋ž˜ํ”ฝ์นด๋“œ ์—†์ด๋„ LLM์„ ๋กœ์ปฌ์—์„œ ํšจ์œจ์ ์œผ๋กœ ๊ตฌ๋™ํ•  ์ˆ˜๋Š” ์—†์„๊นŒ์š”? ๐Ÿค”

์ •๋‹ต์€ “๋„ค, ๊ฐ€๋Šฅํ•ฉ๋‹ˆ๋‹ค!” โœจ ๋ฐ”๋กœ LM Studio์™€ ๋ช‡ ๊ฐ€์ง€ ์ตœ์ ํ™” ์„ค์ •์„ ํ†ตํ•ด์„œ ๋ง์ด์ฃ . ์˜ค๋Š˜์€ GPU๊ฐ€ ์—†๊ฑฐ๋‚˜ ๋ถ€์กฑํ•œ ํ™˜๊ฒฝ์—์„œ๋„ LM Studio๋ฅผ ํ™œ์šฉํ•˜์—ฌ LLM ์„ฑ๋Šฅ์„ ์ตœ๋Œ€ํ•œ์œผ๋กœ ๋Œ์–ด์˜ฌ๋ฆฌ๋Š” ๋น„๋ฒ•์„ ์ž์„ธํžˆ ์•Œ๋ ค๋“œ๋ฆฌ๊ฒ ์Šต๋‹ˆ๋‹ค. ๐Ÿš€


1. ์™œ GPU ์—†์ด LM Studio๋ฅผ ์‚ฌ์šฉํ• ๊นŒ? ๐Ÿ’ป

LLM์€ ๋ฐฉ๋Œ€ํ•œ ํŒŒ๋ผ๋ฏธํ„ฐ์™€ ๋ฐ์ดํ„ฐ๋กœ ํ•™์Šต๋˜๊ธฐ ๋•Œ๋ฌธ์—, ์ผ๋ฐ˜์ ์œผ๋กœ ๊ณ ์„ฑ๋Šฅ GPU ๋ฉ”๋ชจ๋ฆฌ(VRAM)๋ฅผ ๋งŽ์ด ํ•„์š”๋กœ ํ•ฉ๋‹ˆ๋‹ค. ํ•˜์ง€๋งŒ LM Studio๋Š” ํŠน์ • ํŒŒ์ผ ํ˜•์‹์ธ GGUF(GPT-Generated Unified Format) ๋ชจ๋ธ์„ ์ง€์›ํ•˜์—ฌ, ์ด ๋ชจ๋ธ๋“ค์€ CPU์™€ ์‹œ์Šคํ…œ RAM์„ ํšจ์œจ์ ์œผ๋กœ ํ™œ์šฉํ•˜๋„๋ก ์„ค๊ณ„๋˜์—ˆ์Šต๋‹ˆ๋‹ค.

  • ์ง„์ž… ์žฅ๋ฒฝ ๊ฐ์†Œ: ๊ณ ๊ฐ€์˜ GPU ์—†์ด๋„ ๋กœ์ปฌ LLM์„ ๊ฒฝํ—˜ํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ๐Ÿ’ฐ
  • ํ”„๋ผ์ด๋ฒ„์‹œ ๋ณดํ˜ธ: ์ธํ„ฐ๋„ท ์—ฐ๊ฒฐ ์—†์ด ๋‚ด PC์—์„œ ๋ชจ๋ธ์„ ์‹คํ–‰ํ•˜๋ฏ€๋กœ ๋ฐ์ดํ„ฐ ์œ ์ถœ ๊ฑฑ์ • ์—†์ด ์•ˆ์ „ํ•˜๊ฒŒ ์‚ฌ์šฉํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ๐Ÿ”’
  • ์˜คํ”„๋ผ์ธ ์‚ฌ์šฉ ๊ฐ€๋Šฅ: ์ธํ„ฐ๋„ท์ด ๋Š๊ฒจ๋„ ์–ธ์ œ๋“ ์ง€ ๋ชจ๋ธ์„ ์‚ฌ์šฉํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ๐ŸŒ
  • ๊ฐœ๋ฐœ ๋ฐ ์‹คํ—˜ ์šฉ์ด์„ฑ: ์ƒˆ๋กœ์šด ๋ชจ๋ธ์ด๋‚˜ ์„ค์ • ํ…Œ์ŠคํŠธ์— ์ตœ์ ํ™”๋˜์–ด ์žˆ์Šต๋‹ˆ๋‹ค. ๐Ÿงช

2. LM Studio ์ตœ์ ํ™”์˜ ํ•ต์‹ฌ ์›๋ฆฌ: ์ดํ•ด๊ฐ€ ๊ณง ์„ฑ๋Šฅ! ๐Ÿง 

GPU ์—†์ด LLM์„ ๊ตฌ๋™ํ•  ๋•Œ ๊ฐ€์žฅ ์ค‘์š”ํ•œ ๊ฒƒ์€ ๋ชจ๋ธ์˜ ํšจ์œจ์ ์ธ ๋ฉ”๋ชจ๋ฆฌ ์‚ฌ์šฉ๊ณผ CPU์˜ ์—ฐ์‚ฐ ๋Šฅ๋ ฅ ์ตœ๋Œ€ ํ™œ์šฉ์ž…๋‹ˆ๋‹ค. LM Studio ์ตœ์ ํ™”์˜ ํ•ต์‹ฌ ์›๋ฆฌ๋Š” ๋‹ค์Œ๊ณผ ๊ฐ™์Šต๋‹ˆ๋‹ค.

  • ์–‘์žํ™”(Quantization): LLM ๋ชจ๋ธ์€ ๋ณดํ†ต 16๋น„ํŠธ(BF16)๋‚˜ 32๋น„ํŠธ(FP32)์˜ ์ •๋ฐ€๋„๋กœ ํ•™์Šต๋ฉ๋‹ˆ๋‹ค. ์–‘์žํ™”๋Š” ์ด ์ •๋ฐ€๋„๋ฅผ 8๋น„ํŠธ, 4๋น„ํŠธ, ์‹ฌ์ง€์–ด 2~3๋น„ํŠธ(Q2_K, Q3_K ๋“ฑ)๋กœ ๋‚ฎ์ถฐ ๋ชจ๋ธ ํŒŒ์ผ ํฌ๊ธฐ์™€ ๋ฉ”๋ชจ๋ฆฌ ์‚ฌ์šฉ๋Ÿ‰์„ ํš๊ธฐ์ ์œผ๋กœ ์ค„์ด๋Š” ๊ธฐ์ˆ ์ž…๋‹ˆ๋‹ค. ๐Ÿ’พ
    • ์žฅ์ : ๋ชจ๋ธ ๋กœ๋”ฉ ์†๋„ ํ–ฅ์ƒ, ์ ์€ RAM์œผ๋กœ ๋” ํฐ ๋ชจ๋ธ ์‹คํ–‰ ๊ฐ€๋Šฅ, ๋น ๋ฅธ ์ถ”๋ก  ์†๋„.
    • ๋‹จ์ : ์ •๋ฐ€๋„๊ฐ€ ๋‚ฎ์•„์ง€๋ฉด์„œ ๋ฏธ์„ธํ•œ ์„ฑ๋Šฅ ์ €ํ•˜๊ฐ€ ๋ฐœ์ƒํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค (ํ•˜์ง€๋งŒ ๋Œ€๋ถ€๋ถ„์˜ ์‚ฌ์šฉ ์‚ฌ๋ก€์—์„œ๋Š” ์ฒด๊ฐํ•˜๊ธฐ ์–ด๋ ต์Šต๋‹ˆ๋‹ค).
  • ์ž์› ๊ด€๋ฆฌ: CPU ์ฝ”์–ด ์ˆ˜, ์‹œ์Šคํ…œ RAM ํฌ๊ธฐ, ์ปจํ…์ŠคํŠธ ๊ธธ์ด ๋“ฑ์„ ์กฐ์ ˆํ•˜์—ฌ ํ•˜๋“œ์›จ์–ด ์ œ์•ฝ์„ ๊ทน๋ณตํ•ฉ๋‹ˆ๋‹ค. โš™๏ธ

3. LM Studio ์„ค์ • ์™„์ „ ์ •๋ณต: ๋‹จ๊ณ„๋ณ„ ์ตœ์ ํ™” ๊ฐ€์ด๋“œ โœ…

์ด์ œ LM Studio๋ฅผ ์‹คํ–‰ํ•˜๊ณ  ๋ณธ๊ฒฉ์ ์œผ๋กœ ์ตœ์ ํ™” ์„ค์ •์„ ํ•ด๋ด…์‹œ๋‹ค!

3.1. ๐Ÿ† ๋ชจ๋ธ ์„ ํƒ์˜ ์ค‘์š”์„ฑ: ์ ˆ๋ฐ˜์€ ๋จน๊ณ  ๋“ค์–ด๊ฐ„๋‹ค!

์•„๋ฌด๋ฆฌ ์„ค์ •์„ ์ž˜ํ•ด๋„, ์ฒ˜์Œ๋ถ€ํ„ฐ ๋„ˆ๋ฌด ํฐ ๋ชจ๋ธ์„ ์„ ํƒํ•˜๋ฉด ๋‹ต์ด ์—†์Šต๋‹ˆ๋‹ค. GPU ์—†๋Š” ํ™˜๊ฒฝ์—์„œ๋Š” ๋ชจ๋ธ ์„ ํƒ์ด ์ตœ์ ํ™”์˜ 50% ์ด์ƒ์„ ์ฐจ์ง€ํ•ฉ๋‹ˆ๋‹ค.

  • ์ž‘์€ ๋ชจ๋ธ๋ถ€ํ„ฐ ์‹œ์ž‘ํ•˜์„ธ์š”:
    • Mistral 7B Instruct: ํ›Œ๋ฅญํ•œ ์„ฑ๋Šฅ๊ณผ ํšจ์œจ์„ฑ์„ ๊ฒธ๋น„ํ•˜์—ฌ ๊ฐ€์žฅ ์ถ”์ฒœํ•˜๋Š” ๋ชจ๋ธ ์ค‘ ํ•˜๋‚˜์ž…๋‹ˆ๋‹ค.
    • Llama 3 8B Instruct: ์ตœ๊ทผ ์ถœ์‹œ๋œ ๋ชจ๋ธ๋กœ, ์ž‘์€ ํฌ๊ธฐ์—๋„ ๋ถˆ๊ตฌํ•˜๊ณ  ๋›ฐ์–ด๋‚œ ์„ฑ๋Šฅ์„ ์ž๋ž‘ํ•ฉ๋‹ˆ๋‹ค.
    • Gemma 2B / 7B: ๊ตฌ๊ธ€์—์„œ ๊ณต๊ฐœํ•œ ๊ฒฝ๋Ÿ‰ ๋ชจ๋ธ๋กœ, ํŠน์ • ์ž‘์—…์— ๊ฐ•์ ์„ ๋ณด์ž…๋‹ˆ๋‹ค.
    • TinyLlama: ์•„์ฃผ ์ž‘์€ ๋ชจ๋ธ๋กœ, ํ•™์Šต์šฉ์ด๋‚˜ ๊ฐ„๋‹จํ•œ ํ…Œ์ŠคํŠธ์— ์ ํ•ฉํ•ฉ๋‹ˆ๋‹ค.
  • ์–‘์žํ™”(Quantization) ๋ ˆ๋ฒจ ์„ ํƒ: ๋ชจ๋ธ ํŒŒ์ผ๋ช…์— Q4_K_M, Q5_K_S ๋“ฑ ์–‘์žํ™” ๋ ˆ๋ฒจ์ด ํ‘œ์‹œ๋˜์–ด ์žˆ์Šต๋‹ˆ๋‹ค.

    • RAM์ด ๋ถ€์กฑํ•˜๋‹ค๋ฉด: Q2_K, Q3_K_M, Q4_K_S ๋“ฑ ๋‚ฎ์€ ์–‘์žํ™” ๋ ˆ๋ฒจ์„ ์„ ํƒํ•˜์„ธ์š”. ํŒŒ์ผ ํฌ๊ธฐ๊ฐ€ ๊ฐ€์žฅ ์ž‘๊ณ , ์ตœ์†Œํ•œ์˜ RAM์œผ๋กœ ์‹คํ–‰ ๊ฐ€๋Šฅํ•ฉ๋‹ˆ๋‹ค. (์˜ˆ: Llama 3 8B Q2_K๋Š” 4GB RAM์œผ๋กœ๋„ ๊ตฌ๋™ ๊ฐ€๋Šฅ!)
    • ์„ฑ๋Šฅ๊ณผ RAM์˜ ๊ท ํ˜•์„ ์›ํ•œ๋‹ค๋ฉด: Q4_K_M, Q5_K_S, Q5_K_M ๋“ฑ์ด ์ข‹์Šต๋‹ˆ๋‹ค. ์ผ๋ฐ˜์ ์œผ๋กœ ๊ถŒ์žฅ๋˜๋Š” ์ˆ˜์ค€์ด๋ฉฐ, ์„ฑ๋Šฅ ์ €ํ•˜๊ฐ€ ๋ฏธ๋ฏธํ•ฉ๋‹ˆ๋‹ค.
    • ์ตœ๊ณ ์˜ ํ’ˆ์งˆ์„ ์›ํ•œ๋‹ค๋ฉด (RAM ์ถฉ๋ถ„ ์‹œ): Q6_K, Q8_0์„ ์„ ํƒํ•ฉ๋‹ˆ๋‹ค. ํŒŒ์ผ ํฌ๊ธฐ๊ฐ€ ํฌ๊ณ  RAM์„ ๋งŽ์ด ์‚ฌ์šฉํ•˜์ง€๋งŒ, ์›๋ณธ ๋ชจ๋ธ์— ๊ฐ€์žฅ ๊ฐ€๊นŒ์šด ํ’ˆ์งˆ์„ ์ œ๊ณตํ•ฉ๋‹ˆ๋‹ค.

    ๐Ÿ’ก ํŒ: LM Studio์—์„œ ๋ชจ๋ธ์„ ๋‹ค์šด๋กœ๋“œํ•  ๋•Œ, ์—ฌ๋Ÿฌ ์–‘์žํ™” ๋ฒ„์ „์ด ๋ณด์ž…๋‹ˆ๋‹ค. ์ž์‹ ์˜ RAM ์šฉ๋Ÿ‰์— ๋งž๋Š” ๋ฒ„์ „์„ ์„ ํƒํ•˜๋Š” ๊ฒƒ์ด ์ค‘์š”ํ•ฉ๋‹ˆ๋‹ค.

    • RAM 8GB ๋ฏธ๋งŒ: Q2_K, Q3_K
    • RAM 8~16GB: Q4_K, Q5_K
    • RAM 16GB ์ด์ƒ: Q5_K, Q6_K, Q8_0 (๋” ํฐ ๋ชจ๋ธ๋„ ์‹œ๋„ ๊ฐ€๋Šฅ)

3.2. โš™๏ธ ๊ณ ๊ธ‰ ์„ค์ •(Advanced Settings) ํŒŒ๊ณ ๋“ค๊ธฐ

LM Studio ์ขŒ์ธก ํ•˜๋‹จ์˜ ํ†ฑ๋‹ˆ๋ฐ”ํ€ด ์•„์ด์ฝ˜(Settings)์„ ํด๋ฆญํ•˜์—ฌ ๊ณ ๊ธ‰ ์„ค์ •์„ ์กฐ์ •ํ•ฉ๋‹ˆ๋‹ค.

  • Inference Settings:

    • n_threads (CPU ์ฝ”์–ด ์‚ฌ์šฉ):
      • ์ด ์„ค์ •์€ LLM ์ถ”๋ก ์— ์‚ฌ์šฉํ•  CPU ์ฝ”์–ด(์Šค๋ ˆ๋“œ) ์ˆ˜๋ฅผ ๊ฒฐ์ •ํ•ฉ๋‹ˆ๋‹ค. ๋„ˆ๋ฌด ๋งŽ์œผ๋ฉด ์˜ค๋ฒ„ํ—ค๋“œ๋กœ ์ธํ•ด ์˜คํžˆ๋ ค ๋А๋ ค์งˆ ์ˆ˜ ์žˆ๊ณ , ๋„ˆ๋ฌด ์ ์œผ๋ฉด CPU๋ฅผ ์ œ๋Œ€๋กœ ํ™œ์šฉํ•˜์ง€ ๋ชปํ•ฉ๋‹ˆ๋‹ค.
      • ๊ถŒ์žฅ ์„ค์ •: ์ž์‹ ์˜ ๋ฌผ๋ฆฌ์  CPU ์ฝ”์–ด ์ˆ˜์—์„œ 1~2๊ฐœ ๋บ€ ๊ฐ’์œผ๋กœ ์„ค์ •ํ•˜๋Š” ๊ฒƒ์ด ์ผ๋ฐ˜์ ์ž…๋‹ˆ๋‹ค. (์˜ˆ: 8์ฝ”์–ด CPU๋ผ๋ฉด 6~7 ์Šค๋ ˆ๋“œ)
      • ์„ค์ • ๋ฐฉ๋ฒ•: LM Studio ์ฑ„ํŒ… ํ™”๋ฉด ํ•˜๋‹จ์˜ “CPU Threads” ์Šฌ๋ผ์ด๋”๋ฅผ ์กฐ์ ˆํ•˜๊ฑฐ๋‚˜, n_threads ํ…์ŠคํŠธ ๋ฐ•์Šค์— ์ง์ ‘ ์ž…๋ ฅํ•ฉ๋‹ˆ๋‹ค.
      • ์‹คํ—˜์ด ์ค‘์š”!: ์—ฌ๋Ÿฌ ๊ฐ’์„ ์‹œ๋„ํ•˜์—ฌ ์ž์‹ ์˜ ์‹œ์Šคํ…œ์—์„œ ๊ฐ€์žฅ ์ข‹์€ tokens/s (์ดˆ๋‹น ํ† ํฐ ์ƒ์„ฑ ์ˆ˜)๋ฅผ ์ฐพ์•„๋ณด์„ธ์š”.
    • n_ctx (์ปจํ…์ŠคํŠธ ๊ธธ์ด):
      • ๋ชจ๋ธ์ด ํ•œ ๋ฒˆ์— ์ฒ˜๋ฆฌํ•  ์ˆ˜ ์žˆ๋Š” ์ž…๋ ฅ ๋ฐ ์ถœ๋ ฅ ํ…์ŠคํŠธ์˜ ์ตœ๋Œ€ ๊ธธ์ด(ํ† ํฐ ๋‹จ์œ„)์ž…๋‹ˆ๋‹ค. ํ”„๋กฌํ”„ํŠธ์™€ ๋ชจ๋ธ์˜ ์‘๋‹ต์ด ๋ชจ๋‘ ํฌํ•จ๋ฉ๋‹ˆ๋‹ค.
      • ๊ถŒ์žฅ ์„ค์ •: ์‚ฌ์šฉํ•˜๋Š” ๋ชจ๋ธ์˜ ๊ถŒ์žฅ ์ปจํ…์ŠคํŠธ ๊ธธ์ด๋ฅผ ํ™•์ธํ•˜๊ณ , ์ž์‹ ์˜ RAM ์šฉ๋Ÿ‰์— ๋งž์ถฐ ์กฐ์ ˆํ•ฉ๋‹ˆ๋‹ค. ์ผ๋ฐ˜์ ์œผ๋กœ 1024, 2048, 4096 ๋“ฑ์ด ๋งŽ์ด ์‚ฌ์šฉ๋ฉ๋‹ˆ๋‹ค.
      • ์ฃผ์˜: ์ปจํ…์ŠคํŠธ ๊ธธ์ด๊ฐ€ ๊ธธ์–ด์งˆ์ˆ˜๋ก ๋” ๋งŽ์€ RAM์„ ์‚ฌ์šฉํ•˜๊ณ  ์ถ”๋ก  ์†๋„๊ฐ€ ๋А๋ ค์ง‘๋‹ˆ๋‹ค. ํ•„์š”ํ•œ ๋งŒํผ๋งŒ ์„ค์ •ํ•˜๋Š” ๊ฒƒ์ด ์ค‘์š”ํ•ฉ๋‹ˆ๋‹ค. ๋ถˆํ•„์š”ํ•˜๊ฒŒ ๋Š˜๋ฆฌ์ง€ ๋งˆ์„ธ์š”.
    • n_batch (๋ฐฐ์น˜ ์ฒ˜๋ฆฌ):
      • ํ”„๋กฌํ”„ํŠธ๊ฐ€ ๊ธธ๊ฑฐ๋‚˜ ์—ฌ๋Ÿฌ ์š”์ฒญ์„ ํ•œ ๋ฒˆ์— ์ฒ˜๋ฆฌํ•  ๋•Œ ์œ ์šฉํ•ฉ๋‹ˆ๋‹ค.
      • ๊ถŒ์žฅ ์„ค์ •: ํ…์ŠคํŠธ๋ฅผ ์ƒ์„ฑํ•˜๋Š” ๋ฐ ๊ฑธ๋ฆฌ๋Š” ์‹œ๊ฐ„์„ ์ค„์ผ ์ˆ˜ ์žˆ์ง€๋งŒ, ๋„ˆ๋ฌด ๋†’๊ฒŒ ์„ค์ •ํ•˜๋ฉด RAM ์‚ฌ์šฉ๋Ÿ‰์ด ์ฆ๊ฐ€ํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ์ž‘์€ ๊ฐ’(์˜ˆ: 8~16)๋ถ€ํ„ฐ ์‹œ์ž‘ํ•˜์—ฌ ํ…Œ์ŠคํŠธํ•ด๋ณด์„ธ์š”.
    • n_gpu_layers (GPU ๋ ˆ์ด์–ด ์˜คํ”„๋กœ๋“œ):
      • GPU๊ฐ€ ์—†๋Š” ๊ฒฝ์šฐ: ์ด ์„ค์ •์„ 0์œผ๋กœ ๋‘๊ฑฐ๋‚˜ ์•„์˜ˆ ๊ฑด๋“œ๋ฆฌ์ง€ ๋งˆ์„ธ์š”. GPU ๋ฉ”๋ชจ๋ฆฌ๊ฐ€ ์•„๋‹Œ ์‹œ์Šคํ…œ RAM์„ ์‚ฌ์šฉํ•˜๊ฒŒ ๋ฉ๋‹ˆ๋‹ค. (GPU๊ฐ€ ์žˆ๋‹ค๋ฉด ์ด ๊ฐ’์„ ํ†ตํ•ด GPU์— ์ผ๋ถ€ ๋ ˆ์ด์–ด๋ฅผ ์˜ฌ๋ ค ์„ฑ๋Šฅ์„ ๋†’์ผ ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.)
    • mmap (๋ฉ”๋ชจ๋ฆฌ ๋งตํ•‘):
      • ๋ชจ๋ธ ํŒŒ์ผ์„ RAM์— ์ง์ ‘ ๋งคํ•‘ํ•˜์—ฌ ๋น ๋ฅด๊ฒŒ ๋กœ๋”ฉํ•˜๊ณ  ์ ‘๊ทผํ•  ์ˆ˜ ์žˆ๊ฒŒ ํ•ฉ๋‹ˆ๋‹ค. ๊ธฐ๋ณธ์ ์œผ๋กœ ํ™œ์„ฑํ™”๋˜์–ด ์žˆ์œผ๋ฉฐ, ๋Œ€๋ถ€๋ถ„์˜ ๊ฒฝ์šฐ ๊ทธ๋Œ€๋กœ ๋‘๋Š” ๊ฒƒ์ด ์ข‹์Šต๋‹ˆ๋‹ค.
    • mlock (๋ฉ”๋ชจ๋ฆฌ ์ž ๊ธˆ):
      • ๋ชจ๋ธ์ด RAM์— ๋กœ๋“œ๋  ๋•Œ, ํ•ด๋‹น ๋ฉ”๋ชจ๋ฆฌ ์˜์—ญ์ด ์Šค์™‘(Swap) ํŒŒ์ผ๋กœ ๋‚ด๋ ค๊ฐ€์ง€ ์•Š๋„๋ก ์ž ๊ธ‰๋‹ˆ๋‹ค. ์ด๋Š” ๋ชจ๋ธ์˜ ์‘๋‹ต ์†๋„๋ฅผ ํ–ฅ์ƒ์‹œํ‚ค์ง€๋งŒ, ๋‹ค๋ฅธ ํ”„๋กœ๊ทธ๋žจ์ด ์‚ฌ์šฉํ•  ์ˆ˜ ์žˆ๋Š” RAM ๊ณต๊ฐ„์„ ์ค„์ผ ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.
      • ๊ถŒ์žฅ ์„ค์ •: RAM์ด ์ถฉ๋ถ„ํ•˜๋‹ค๋ฉด ํ™œ์„ฑํ™”(์ฒดํฌ)ํ•˜๋Š” ๊ฒƒ์ด ์ข‹์ง€๋งŒ, RAM ๋ถ€์กฑ ๋ฌธ์ œ๊ฐ€ ๋ฐœ์ƒํ•œ๋‹ค๋ฉด ๋น„ํ™œ์„ฑํ™”(์ฒดํฌ ํ•ด์ œ)๋ฅผ ์‹œ๋„ํ•ด๋ณผ ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.
  • Cache Settings:

    • prompt_cache_all, prompt_cache_seq_id:
      • ์ด ์„ค์ •๋“ค์€ ์ด์ „์— ์‚ฌ์šฉํ–ˆ๋˜ ํ”„๋กฌํ”„ํŠธ์˜ ์ผ๋ถ€๋ฅผ ์บ์‹ฑํ•˜์—ฌ ๋™์ผํ•˜๊ฑฐ๋‚˜ ์œ ์‚ฌํ•œ ํ”„๋กฌํ”„ํŠธ๊ฐ€ ๋‹ค์‹œ ๋“ค์–ด์™”์„ ๋•Œ ์ฒ˜๋ฆฌ ์†๋„๋ฅผ ๋น ๋ฅด๊ฒŒ ํ•ฉ๋‹ˆ๋‹ค. ํ™œ์„ฑํ™”ํ•˜๋Š” ๊ฒƒ์ด ์ผ๋ฐ˜์ ์œผ๋กœ ์„ฑ๋Šฅ์— ์œ ๋ฆฌํ•ฉ๋‹ˆ๋‹ค.

4. LM Studio ์‚ฌ์šฉ ๊ฟ€ํŒ! ์„ฑ๋Šฅ ๋ชจ๋‹ˆํ„ฐ๋ง ๋ฐ ๋ฌธ์ œ ํ•ด๊ฒฐ ๐Ÿ“Š

์ตœ์ ํ™”๋Š” ํ•œ ๋ฒˆ์˜ ์„ค์ •์œผ๋กœ ๋๋‚˜๋Š” ๊ฒƒ์ด ์•„๋‹™๋‹ˆ๋‹ค. ์ง€์†์ ์ธ ๋ชจ๋‹ˆํ„ฐ๋ง๊ณผ ์กฐ์ •์ด ํ•„์š”ํ•ฉ๋‹ˆ๋‹ค.

  • ์„ฑ๋Šฅ ๋ชจ๋‹ˆํ„ฐ๋ง:
    • LM Studio “Server Logs” ํ™•์ธ: ์ฑ„ํŒ… ์ฐฝ ํ•˜๋‹จ์˜ “Server Logs”๋ฅผ ํด๋ฆญํ•˜๋ฉด tokens/s (์ดˆ๋‹น ์ƒ์„ฑ ํ† ํฐ ์ˆ˜)๋ฅผ ํ™•์ธํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ์ด ์ˆ˜์น˜๊ฐ€ ๋†’์„์ˆ˜๋ก ์„ฑ๋Šฅ์ด ์ข‹๋‹ค๋Š” ์˜๋ฏธ์ž…๋‹ˆ๋‹ค.
    • ์ž‘์—… ๊ด€๋ฆฌ์ž(Windows) / ํ™œ๋™ ์ƒํƒœ ๋ณด๊ธฐ(macOS) / htop(Linux) ํ™œ์šฉ: CPU ์‚ฌ์šฉ๋ฅ ๊ณผ RAM ์‚ฌ์šฉ๋Ÿ‰์„ ์‹ค์‹œ๊ฐ„์œผ๋กœ ํ™•์ธํ•˜์—ฌ LM Studio๊ฐ€ ์‹œ์Šคํ…œ ์ž์›์„ ์–ผ๋งˆ๋‚˜ ํ™œ์šฉํ•˜๋Š”์ง€ ํŒŒ์•…ํ•˜์„ธ์š”.
  • ์ผ๋ฐ˜์ ์ธ ๋ฌธ์ œ ๋ฐ ํ•ด๊ฒฐ์ฑ…:
    • “Out of Memory” ์—๋Ÿฌ: โš ๏ธ
      • ์„ ํƒํ•œ ๋ชจ๋ธ์˜ ์–‘์žํ™” ๋ ˆ๋ฒจ์„ ๋” ๋‚ฎ์ถฅ๋‹ˆ๋‹ค. (์˜ˆ: Q5_K -> Q4_K -> Q3_K)
      • ๋” ์ž‘์€ ๋ชจ๋ธ๋กœ ๋ณ€๊ฒฝํ•ฉ๋‹ˆ๋‹ค. (์˜ˆ: 13B ๋ชจ๋ธ -> 7B ๋ชจ๋ธ)
      • n_ctx (์ปจํ…์ŠคํŠธ ๊ธธ์ด)๋ฅผ ์ค„์ž…๋‹ˆ๋‹ค.
      • mlock ์„ค์ •์„ ๋น„ํ™œ์„ฑํ™”ํ•ฉ๋‹ˆ๋‹ค.
      • ๋‹ค๋ฅธ ๋ถˆํ•„์š”ํ•œ ํ”„๋กœ๊ทธ๋žจ์„ ์ข…๋ฃŒํ•˜์—ฌ RAM์„ ํ™•๋ณดํ•ฉ๋‹ˆ๋‹ค.
    • ์‘๋‹ต ์†๋„๊ฐ€ ๋„ˆ๋ฌด ๋А๋ ค์š”: ๐Ÿข
      • n_threads ๊ฐ’์„ ์กฐ์ ˆํ•˜์—ฌ ์ตœ์ ์˜ CPU ํ™œ์šฉ๋„๋ฅผ ์ฐพ์Šต๋‹ˆ๋‹ค.
      • ๋” ๋‚ฎ์€ ์–‘์žํ™” ๋ ˆ๋ฒจ์˜ ๋ชจ๋ธ์„ ์‚ฌ์šฉํ•ฉ๋‹ˆ๋‹ค.
      • ๋” ์ž‘์€ ๋ชจ๋ธ๋กœ ๋ณ€๊ฒฝํ•ฉ๋‹ˆ๋‹ค.
      • ์‹œ์Šคํ…œ์˜ SSD/NVMe ์†๋„๊ฐ€ ๋А๋ฆฌ๋‹ค๋ฉด ๋ชจ๋ธ ๋กœ๋”ฉ์ด ์˜ค๋ž˜ ๊ฑธ๋ฆด ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.
    • ์‘๋‹ต ํ’ˆ์งˆ์ด ๋–จ์–ด์ง„ ๊ฒƒ ๊ฐ™์•„์š”: ๐Ÿค”
      • ๋” ๋†’์€ ์–‘์žํ™” ๋ ˆ๋ฒจ์˜ ๋ชจ๋ธ์„ ์‹œ๋„ํ•ด ๋ด…๋‹ˆ๋‹ค. (RAM ํ—ˆ์šฉ ๋ฒ”์œ„ ๋‚ด์—์„œ)
      • ํ”„๋กฌํ”„ํŠธ๋ฅผ ๋” ๋ช…ํ™•ํ•˜๊ณ  ๊ตฌ์ฒด์ ์œผ๋กœ ์ž‘์„ฑํ•˜์—ฌ ๋ชจ๋ธ์˜ ์ดํ•ด๋„๋ฅผ ๋†’์ž…๋‹ˆ๋‹ค.

5. ๊ฒฐ๋ก : GPU ์—†์ด๋„ LLM์˜ ๋งˆ๋ฒ•์„ ๊ฒฝํ—˜ํ•˜์„ธ์š”! โœจ

๋ณด์…จ๋“ฏ์ด, ๊ณ ๊ฐ€์˜ GPU๊ฐ€ ์—†์–ด๋„ LM Studio์˜ ๋˜‘๋˜‘ํ•œ ์ตœ์ ํ™” ์„ค์ •์„ ํ†ตํ•ด LLM์˜ ๋†€๋ผ์šด ์„ฑ๋Šฅ์„ ์ถฉ๋ถ„ํžˆ ๊ฒฝํ—˜ํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ์ค‘์š”ํ•œ ๊ฒƒ์€ ์ž์‹ ์˜ ํ•˜๋“œ์›จ์–ด ํ™˜๊ฒฝ์„ ์ดํ•ดํ•˜๊ณ , ๊ทธ์— ๋งž๋Š” ๋ชจ๋ธ์„ ์„ ํƒํ•˜๋ฉฐ, LM Studio์˜ ๋‹ค์–‘ํ•œ ์„ค์ •์„ ์ ๊ทน์ ์œผ๋กœ ์กฐ์ ˆํ•˜๋ฉฐ ์‹คํ—˜ํ•˜๋Š” ๊ฒƒ์ž…๋‹ˆ๋‹ค.

์ด ๊ฐ€์ด๋“œ๊ฐ€ ์—ฌ๋Ÿฌ๋ถ„์˜ ๋กœ์ปฌ LLM ๊ฒฝํ—˜์„ ๋”์šฑ ํ’๋ถ€ํ•˜๊ฒŒ ๋งŒ๋“œ๋Š” ๋ฐ ๋„์›€์ด ๋˜์—ˆ๊ธฐ๋ฅผ ๋ฐ”๋ž๋‹ˆ๋‹ค. ๊ถ๊ธˆํ•œ ์ ์ด๋‚˜ ๋” ์ข‹์€ ํŒ์ด ์žˆ๋‹ค๋ฉด ์–ธ์ œ๋“ ์ง€ ๋Œ“๊ธ€๋กœ ๊ณต์œ ํ•ด์ฃผ์„ธ์š”! ๋‹ค์Œ์—๋„ ์œ ์ตํ•œ ์ •๋ณด๋กœ ์ฐพ์•„์˜ค๊ฒ ์Šต๋‹ˆ๋‹ค. ํ•ดํ”ผ AI ๋ผ์ดํ”„! ๐Ÿ‘‹ G

๋‹ต๊ธ€ ๋‚จ๊ธฐ๊ธฐ

์ด๋ฉ”์ผ ์ฃผ์†Œ๋Š” ๊ณต๊ฐœ๋˜์ง€ ์•Š์Šต๋‹ˆ๋‹ค. ํ•„์ˆ˜ ํ•„๋“œ๋Š” *๋กœ ํ‘œ์‹œ๋ฉ๋‹ˆ๋‹ค