YAML Metadata Warning: empty or missing yaml metadata in repo card (https://huggingface.co/docs/hub/model-cards#model-card-metadata)

๋ชจ๋ธ ๊ฐœ์š”

์ด ์ฑ—๋ด‡์€ ๋Œ€ํ•œ๋ฏผ๊ตญ์—์„œ ๋ฐœ์ƒํ•œ ์˜๋ฃŒ ์ „๋ฌธ ์ธ๋ ฅ ๋ถ€์กฑ๊ณผ ์˜์‚ฌ ํŒŒ์—…์œผ๋กœ ์ธํ•œ ์˜๋ฃŒ ์œ„๊ธฐ๋ฅผ ๋Œ€์‘ํ•˜๊ธฐ ์œ„ํ•ด ๊ฐœ๋ฐœ๋˜์—ˆ์Šต๋‹ˆ๋‹ค. ์ดˆ๊ฑฐ๋Œ€ AI ํ—ฌ์Šค์ผ€์–ด ์งˆ์˜์‘๋‹ต ๋ฐ์ดํ„ฐ๋ฅผ ํ™œ์šฉํ•˜์—ฌ ์˜๋ฃŒ ๋ถ„์•ผ์˜ ์ „๋ฌธ ์ง€์‹์„ ํฌํ•จํ•œ ๋Œ€๊ทœ๋ชจ AI ๋ชจ๋ธ์„ ๊ธฐ๋ฐ˜์œผ๋กœ ํ•˜๋ฉฐ, ํ™˜์ž๋“ค์—๊ฒŒ ์‹ ์†ํ•˜๊ณ  ์ •ํ™•ํ•œ ์˜๋ฃŒ ์ •๋ณด๋ฅผ ์ œ๊ณตํ•ฉ๋‹ˆ๋‹ค.

๋ชจ๋ธ ์ƒ์„ธ ์„ค๋ช…

  • ๋ชจ๋ธ๋ช…: RAFT + RAG ๊ธฐ๋ฐ˜ ์˜๋ฃŒ ์ƒ๋‹ด ์ฑ—๋ด‡
  • ๊ธฐ๋ฐ˜ ๋ชจ๋ธ: Gemma-2-2b-it
  • ํ•™์Šต ๋ฐฉ๋ฒ•: GPT 4o-mini๋ฅผ ํ™œ์šฉํ•œ ๋ฐ์ดํ„ฐ ์ฆ๊ฐ• ๋ฐ RAFT ๋ฐฉ๋ฒ• ์ ์šฉ
  • ์•„ํ‚คํ…์ฒ˜: Gemma-2-2b-it๊ณผ ๋™์ผํ•œ ๊ตฌ์กฐ ์‚ฌ์šฉ

๋ฐ์ดํ„ฐ์…‹

  • ๋ฐ์ดํ„ฐ์…‹ ์ด๋ฆ„: ์ดˆ๊ฑฐ๋Œ€ AI ํ—ฌ์Šค์ผ€์–ด ์งˆ์˜์‘๋‹ต ๋ฐ์ดํ„ฐ
  • ์ถœ์ฒ˜: AI ํ—ˆ๋ธŒ
  • ๋ฐ์ดํ„ฐ ๊ตฌ์„ฑ:
    • 40%: ์ •๋‹ต์ด ํฌํ•จ๋œ ๋ฌธ์„œ 1๊ฐœ + ์ •๋‹ต๊ณผ ๊ด€๋ จ ์—†๋Š” ๋ฌธ์„œ 1๊ฐœ
    • 60%: ์ •๋‹ต๊ณผ ๊ด€๋ จ ์—†๋Š” ๋ฌธ์„œ 2๊ฐœ

ํ•™์Šต ๋ฐฉ๋ฒ•

๋ชจ๋ธ์€ GPT 4o-mini๋ฅผ ํ™œ์šฉํ•œ ๋ฐ์ดํ„ฐ ์ฆ๊ฐ• ๊ธฐ๋ฒ•๊ณผ RAFT(Adapting Language Model to Domain Specific RAG) ๋ฐฉ๋ฒ•์„ ์ ์šฉํ•˜์—ฌ ํ•™์Šต๋˜์—ˆ์Šต๋‹ˆ๋‹ค. ์ด๋Ÿฌํ•œ ๋ฐฉ๋ฒ•์„ ํ†ตํ•ด ๋ชจ๋ธ์€ ๋ณต์žกํ•œ ๋ฌธ๋งฅ ์ดํ•ด์™€ ์ •ํ™•ํ•œ ์ •๋ณด ๊ฒ€์ƒ‰ ๋Šฅ๋ ฅ์„ ํ–ฅ์ƒ์‹œ์ผฐ์Šต๋‹ˆ๋‹ค.

์˜ˆ์‹œ

<bos><start_of_turn>user
<Question>: ์กฑ์ € ๊ทผ๋ง‰์—ผ ์žฌํ™œ์„ ์œ„ํ•ด ์–ด๋–ค ์กฐ์น˜๋ฅผ ์ทจํ•ด์•ผ ํ•˜๋‚˜์š”?
<Documents>: [
  '์กฑ์ € ๊ทผ๋ง‰์—ผ ์žฌํ™œ์€ ๋ฐœ ๊ฑด๊ฐ•์„ ํšŒ๋ณตํ•˜๊ณ  ํ†ต์ฆ์„ ์™„ํ™”ํ•˜๊ธฐ ์œ„ํ•ด ๋‹ค์–‘ํ•œ ์กฐ์น˜๋“ค์„ ์ทจํ•˜๋Š” ๊ฒƒ์ด ์ค‘์š”ํ•ฉ๋‹ˆ๋‹ค. ...',
  '์™ธ์ƒ ํ›„ ์ŠคํŠธ๋ ˆ์Šค ์žฅ์•  ์น˜๋ฃŒ๋ฅผ ์œ„ํ•ด ์•ฝ๋ฌผ ์น˜๋ฃŒ๊ฐ€ ์„ ํƒ๋  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ...'
]
<end_of_turn>
<start_of_turn>model
<Answer>: ์กฑ์ € ๊ทผ๋ง‰์—ผ ์žฌํ™œ์„ ์œ„ํ•ด ์ทจํ•ด์•ผ ํ•  ์กฐ์น˜๋Š” ๋‹ค์Œ๊ณผ ๊ฐ™์Šต๋‹ˆ๋‹ค: ...
<end_of_turn><eos>

์˜ˆ์‹œ

์งˆ๋ฌธ:

๋‘ํ†ต์ด ์ž์ฃผ ๋ฐœ์ƒํ•˜๋Š” ์ด์œ ๊ฐ€ ๊ถ๊ธˆํ•ฉ๋‹ˆ๋‹ค. ์ŠคํŠธ๋ ˆ์Šค ๋•Œ๋ฌธ์ผ๊นŒ์š”, ์•„๋‹ˆ๋ฉด ๋‹ค๋ฅธ ๊ฑด๊ฐ• ๋ฌธ์ œ์ผ๊นŒ์š”? ์–ด๋–ค ์ƒํ™ฉ์—์„œ ๋‘ํ†ต์ด ์‹ฌํ•ด์ง€๋Š”์ง€์™€ ํ•จ๊ป˜ ์ฃผ์˜ํ•  ์ ์„ ์•Œ๊ณ  ์‹ถ์–ด์š”.

๋‹ต๋ณ€:

## ๋‘ํ†ต์˜ ์›์ธ

๋‘ํ†ต์€ ์—ฌ๋Ÿฌ ๊ฐ€์ง€ ์›์ธ์œผ๋กœ ๋ฐœ์ƒํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ๊ฐ€์žฅ ์ผ๋ฐ˜์ ์ธ ์›์ธ์œผ๋กœ๋Š” ๋‹ค์Œ๊ณผ ๊ฐ™์€ ๊ฒƒ๋“ค์ด ์žˆ์Šต๋‹ˆ๋‹ค:

1. **์ŠคํŠธ๋ ˆ์Šค**: ์ผ์ƒ์ƒํ™œ์—์„œ์˜ ์ŠคํŠธ๋ ˆ์Šค๋Š” ๋‘ํ†ต์„ ์œ ๋ฐœํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ํŠนํžˆ ์—…๋ฌด๋‚˜ ํ•™์—…, ๊ฐ€์กฑ ๊ด€๊ณ„์—์„œ์˜ ์••๋ฐ•๊ฐ์ด ๋‘ํ†ต์„ ์•…ํ™”์‹œํ‚ฌ ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.
2. **์‹ ์ฒด์  ์š”์ธ**: ๊ทผ์œก์˜ ๊ธด์žฅ, ํ˜ˆ์•ก ์ˆœํ™˜ ๋ฌธ์ œ, ํ˜ธ๋ฅด๋ชฌ ๋ณ€ํ™” ๋“ฑ ์‹ ์ฒด์ ์ธ ์š”์ธ๋„ ๋‘ํ†ต์„ ์œ ๋ฐœํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.
3. **์˜์–‘ ๊ฒฐํ•**: ๋น„ํƒ€๋ฏผ B6 ๊ฒฐํ•์ด๋‚˜ ๋‹จ๋ฐฑ์งˆ ๋ถ€์กฑ์€ ๋‘ํ†ต์„ ์ผ์œผํ‚ฌ ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.
4. **์•ฝ๋ฌผ**: ํŠน์ • ์•ฝ๋ฌผ, ํŠนํžˆ ํ•ญ์šฐ์šธ์ œ๋‚˜ ์ง„ํ†ต์ œ ๋“ฑ์ด ๋‘ํ†ต์„ ์œ ๋ฐœํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.
5. **๋น„๋งŒ**: ์ฒด์ค‘์ด ๊ณผ๋‹คํ•˜๋ฉด ํ˜ˆ์•ก์ˆœํ™˜์ด ์ €ํ•˜๋˜์–ด ๋‘ํ†ต์ด ๋ฐœ์ƒํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.

## ๋‘ํ†ต์˜ ์ฃผ์˜์ 

๋‘ํ†ต์ด ์ž์ฃผ ๋ฐœ์ƒํ•˜๋Š” ๊ฒฝ์šฐ, ๋‹ค์Œ๊ณผ ๊ฐ™์€ ์ฃผ์˜์ ์„ ๋”ฐ๋ฅด๋Š” ๊ฒƒ์ด ์ค‘์š”ํ•ฉ๋‹ˆ๋‹ค:

- **์ŠคํŠธ๋ ˆ์Šค ๊ด€๋ฆฌ**: ์ŠคํŠธ๋ ˆ์Šค๋ฅผ ์ค„์ด๊ธฐ ์œ„ํ•ด ๋ช…์ƒ, ์š”๊ฐ€, ์‹ฌํ˜ธํก ๋“ฑ์˜ ๋ฐฉ๋ฒ•์„ ์‹œ๋„ํ•ด๋ณด์„ธ์š”.
- **๊ฑด๊ฐ•ํ•œ ์‹์Šต๊ด€**: ๊ท ํ˜• ์žกํžŒ ์‹์‚ฌ๋ฅผ ํ•˜๊ณ , ๊ณผ์‹์ด๋‚˜ ํƒ„์ˆ˜ํ™”๋ฌผ ๊ณผ๋‹ค ์„ญ์ทจ๋ฅผ ํ”ผํ•˜์„ธ์š”.
- **๊ทœ์น™์ ์ธ ์šด๋™**: ๋งค์ผ ์งง์€ ์šด๋™์„ ํ†ตํ•ด ํ˜ˆ์•ก์ˆœํ™˜์„ ๊ฐœ์„ ํ•˜๊ณ  ์ŠคํŠธ๋ ˆ์Šค๋ฅผ ์ค„์ด๋Š” ๋ฐ ๋„์›€์ด ๋ฉ๋‹ˆ๋‹ค.
- **์ถฉ๋ถ„ํ•œ ์ˆ˜๋ฉด**: ๊ทœ์น™์ ์ธ ์ˆ˜๋ฉด ํŒจํ„ด์„ ์œ ์ง€ํ•˜๊ณ , ์ž ์ž๊ธฐ ์ „์—๋Š” ์ŠคํŠธ๋ ˆ์Šค๋ฅผ ์ค„์ด๋Š” ๊ฒƒ์ด ์ค‘์š”ํ•ฉ๋‹ˆ๋‹ค.
- **์ „๋ฌธ๊ฐ€ ์ƒ๋‹ด**: ๋‘ํ†ต์ด ๋ฐ˜๋ณต์ ์œผ๋กœ ๋ฐœ์ƒํ•˜๊ฑฐ๋‚˜ ์‹ฌ๊ฐํ•œ ์ฆ์ƒ์ด ์žˆ์„ ๊ฒฝ์šฐ, ์˜์‚ฌ์™€ ์ƒ๋‹ดํ•˜์—ฌ ์ ์ ˆํ•œ ์ง„๋‹จ๊ณผ ์น˜๋ฃŒ๋ฅผ ๋ฐ›๋Š” ๊ฒƒ์ด ํ•„์š”ํ•ฉ๋‹ˆ๋‹ค.

๋‘ํ†ต์€ ์ผ๋ฐ˜์ ์œผ๋กœ ์ผ์ƒ์ƒํ™œ์— ํฐ ์ง€์žฅ์„ ์ฃผ์ง€ ์•Š์ง€๋งŒ, ๋งŒ์•ฝ ์ž์ฃผ ๋ฐœ์ƒํ•˜๊ฑฐ๋‚˜ ์‹ฌ๊ฐํ•œ ์ฆ์ƒ์ด ๋‚˜ํƒ€๋‚œ๋‹ค๋ฉด ์ „๋ฌธ๊ฐ€์˜ ๋„์›€์„ ๋ฐ›๋Š” ๊ฒƒ์ด ์ข‹์Šต๋‹ˆ๋‹ค.

ํ‰๊ฐ€ ๊ฒฐ๊ณผ

๋ณธ ์—ฐ๊ตฌ์—์„œ๋Š” RAFT + RAG ๋ชจ๋ธ๊ณผ ๊ธฐ์กด ๋ชจ๋ธ์ธ Gemma-2-2b-it์„ ๋น„๊ตํ•˜์—ฌ RAGAS: Automated Evaluation of Retrieval Augmented Generation ๋ฐฉ๋ฒ•๋ก ์„ ์‚ฌ์šฉํ•˜์—ฌ ๋‹ต๋ณ€ ์œ ์‚ฌ๋„๋ฅผ ํ‰๊ฐ€ํ–ˆ์Šต๋‹ˆ๋‹ค.

  • Gemma-2-2b-it ๋ชจ๋ธ: ํ‰๊ท  79.98% ์˜ ์œ ์‚ฌ๋„ ๊ธฐ๋ก
  • RAFT + RAG ๋ชจ๋ธ: ํ‰๊ท  96.02% ์˜ ์œ ์‚ฌ๋„ ๊ธฐ๋ก
    • ์ตœ์†Œ ์œ ์‚ฌ๋„: 92.39%
    • ์ตœ๋Œ€ ์œ ์‚ฌ๋„: 98.56%

์•ฝ 16% ์˜ ์„ฑ๋Šฅ ํ–ฅ์ƒ์ด ํ™•์ธ๋˜์—ˆ์œผ๋ฉฐ, ์ด๋Š” RAFT + RAG ๋ชจ๋ธ์ด ๋ณต์žกํ•œ ๋ฌธ๋งฅ๊ณผ ์ •๋ณด ๊ฒ€์ƒ‰์—์„œ ์šฐ์ˆ˜ํ•œ ์ฒ˜๋ฆฌ ๋Šฅ๋ ฅ์„ ๋ณด์œ ํ•˜๊ณ  ์žˆ์Œ์„ ๋‚˜ํƒ€๋ƒ…๋‹ˆ๋‹ค.

image

์‚ฌ์šฉ ๋ฐฉ๋ฒ•

์‚ฌ์šฉ ๋ฐฉ๋ฒ•๊ณผ ์•„ํ‚คํ…์ฒ˜๋Š” Gemma-2-2b-it ๋ชจ๋ธ๊ณผ ๋™์ผํ•ฉ๋‹ˆ๋‹ค. ๋ชจ๋ธ์€ ํ•œ๊ตญ์–ด ์˜๋ฃŒ ์งˆ์˜์— ๋Œ€ํ•ด ์ „๋ฌธ์ ์ธ ๋‹ต๋ณ€์„ ์ œ๊ณตํ•ฉ๋‹ˆ๋‹ค.

๋ชจ๋ธ ๋ฐ ์–‘์žํ™” ๋ฒ„์ „

์•„๋ž˜๋Š” ๋ณธ ๋ชจ๋ธ๊ณผ ์–‘์žํ™”ํ•œ ๋ฒ„์ „, ๊ทธ๋ฆฌ๊ณ  DSF(Domain-Specific Fine-tuning) ๋ชจ๋ธ์˜ ๋งํฌ์ž…๋‹ˆ๋‹ค:

์ œํ•œ ์‚ฌํ•ญ ๋ฐ ์ฃผ์˜์‚ฌํ•ญ

  • ์˜๋ฃŒ ์กฐ์–ธ: ์ด ๋ชจ๋ธ์€ ์˜๋ฃŒ ์ •๋ณด๋ฅผ ์ œ๊ณตํ•˜์ง€๋งŒ, ์ „๋ฌธ์ ์ธ ์˜๋ฃŒ ์ƒ๋‹ด์ด๋‚˜ ์ง„๋‹จ์„ ๋Œ€์ฒดํ•˜์ง€ ์•Š์Šต๋‹ˆ๋‹ค. ๊ฑด๊ฐ• ๊ด€๋ จ ์˜์‚ฌ ๊ฒฐ์ •์€ ๋ฐ˜๋“œ์‹œ ์˜๋ฃŒ ์ „๋ฌธ๊ฐ€์™€ ์ƒ์˜ํ•˜์‹œ๊ธฐ ๋ฐ”๋ž๋‹ˆ๋‹ค.
  • ๋ฐ์ดํ„ฐ ํ•œ๊ณ„: ๋ชจ๋ธ์€ ํ•™์Šต๋œ ๋ฐ์ดํ„ฐ ๋ฒ”์œ„ ๋‚ด์—์„œ ๋‹ต๋ณ€์„ ์ œ๊ณตํ•ฉ๋‹ˆ๋‹ค. ์ตœ์‹  ์˜๋ฃŒ ์ง€์นจ์ด๋‚˜ ๊ฐœ์ธ๋ณ„ ์ƒํ™ฉ์— ๋Œ€ํ•œ ๊ณ ๋ ค๋Š” ๋ถ€์กฑํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.
  • ์ฑ…์ž„ ํ•œ๊ณ„: ์ด ๋ชจ๋ธ์˜ ์‚ฌ์šฉ์œผ๋กœ ๋ฐœ์ƒํ•˜๋Š” ๊ฒฐ๊ณผ์— ๋Œ€ํ•ด ๊ฐœ๋ฐœ์ž๋Š” ์ฑ…์ž„์„ ์ง€์ง€ ์•Š์Šต๋‹ˆ๋‹ค.

์ธ์šฉ

์ด ๋ชจ๋ธ์„ ์‚ฌ์šฉํ•˜๊ฑฐ๋‚˜ ์—ฐ๊ตฌ์— ์ฐธ๊ณ ํ•˜์‹ค ๊ฒฝ์šฐ ๋‹ค์Œ ๋ฌธํ—Œ์„ ์ธ์šฉํ•ด์ฃผ์‹œ๊ธฐ ๋ฐ”๋ž๋‹ˆ๋‹ค:

  • ์ดˆ๊ฑฐ๋Œ€ AI ํ—ฌ์Šค์ผ€์–ด ์งˆ์˜์‘๋‹ต ๋ฐ์ดํ„ฐ: AI ํ—ˆ๋ธŒ, ์ดˆ๊ฑฐ๋Œ€ AI ํ—ฌ์Šค์ผ€์–ด ์งˆ์˜์‘๋‹ต ๋ฐ์ดํ„ฐ
  • Gemma 2 ๋ชจ๋ธ: "Gemma 2: Improving Open Language Models at a Practical Size", 2023.
  • RAFT ๋ฐฉ๋ฒ•๋ก : Park et al., "Adapting Language Model to Domain Specific RAG", arXiv preprint arXiv:2403.10131, 2023.
  • RAGAS ํ‰๊ฐ€ ๋ฐฉ๋ฒ•๋ก : Kim et al., "RAGAS: Automated Evaluation of Retrieval Augmented Generation", 2023.

๋ผ์ด์„ ์Šค

์ด ๋ชจ๋ธ์€ ํ•ด๋‹น ๋ฐ์ดํ„ฐ์…‹๊ณผ ์›์ฒœ ๋ชจ๋ธ์˜ ๋ผ์ด์„ ์Šค ์กฐ๊ฑด์— ๋”ฐ๋ผ ์‚ฌ์šฉํ•ด์•ผ ํ•ฉ๋‹ˆ๋‹ค. ์‚ฌ์šฉ ์ „์— ๋ฐ˜๋“œ์‹œ ๋ผ์ด์„ ์Šค ๋‚ด์šฉ์„ ํ™•์ธํ•˜์‹œ๊ธฐ ๋ฐ”๋ž๋‹ˆ๋‹ค.

Downloads last month
7
Safetensors
Model size
1.55B params
Tensor type
F32
ยท
FP16
ยท
U8
ยท
Inference Providers NEW
This model is not currently available via any of the supported Inference Providers.
The model cannot be deployed to the HF Inference API: The model has no library tag.