ํ ์ค ์์ฝ: ํตํ ๋ด์ฉ์ ์ค์๊ฐ์ผ๋ก STT โ ํ์ง(๋ถ๋ฅ๊ธฐ) โ ๋ฒ๋ฅ ยท๊ธฐ๊ด ๊ทผ๊ฑฐ RAG โ ํ๋ ๊ฐ์ด๋๊น์ง ์๋ดํ๋ ๋ณด์ด์คํผ์ฑ ๋์ ํ๋ซํผ.
2.mp4
- โจ ํต์ฌ ๊ธฐ๋ฅ
- ๐งฑ ์ํคํ ์ฒ
- ๐ ๋ฐ์ดํฐ์
- ๐ง ๏ธ ๋ชจ๋ธ (Models)
- ๐งฉ LLM & RAG
- ๐งช ํ๊ฐ & ๋ฒค์น๋งํฌ
- ๐ ์ฐธ๊ณ ๋ฌธํ
- ์ค์๊ฐ ํ์ง: ์์ฑ์ธ์ โ STT โ ๋ฌธ์ฅ ๋จ์ ๋ถ๋ฅ(์ ์/์์ฌ + ์ํ๋ ์ ์).
- ๊ทผ๊ฑฐ ์ ์: ํ๋ฒยทํ์ฌ์์ก๋ฒยท๊ธ์ต๊ธฐ๊ด ๊ฐ์ด๋ ๋ฑ RAG๋ก ์ ๋ณด์ด์คํผ์ฑ์ธ์ง๋ฅผ ์ฆ์ ์ค๋ช .
- ๋์ ๊ฐ์ด๋: ์ํฉ๋ณ ์ฆ์ ํ๋ ๊ฐ์ด๋(ํตํ ์ข ๋ฃ/๋ํ๋ฒํธ ์ฌํ์ธ/์ ๊ณ ๋ฑ) ์ ๊ณต.
- ์๊ฐํ: ์ํ๋(0โ100) ํ์๋ผ์ธ, ์์ฌ ํค์๋ ํ์ด๋ผ์ดํ .
๊ธฐ์กด ํต์ ์ฌ ์๋ฃจ์ ์ ํ์ง ์ค์ฌ ํ๊ณ๋ฅผ ๋์ด, ํ์ง โ ๊ทผ๊ฑฐ โ ๋์๊น์ง ์์ ํ ๋ณดํธ ํ๋ฆ ์ ๊ณต.
ํ์ดํ๋ผ์ธ
- STT: ํตํ ์์ฑ ์คํธ๋ฆฌ๋ฐ โ ํ ์คํธ ๋ณํ
- ํ์ง(Detection): RoBERTa ๊ธฐ๋ฐ ๋ถ๋ฅ๊ธฐ โ ๋ณด์ด์คํผ์ฑ ํ๋ฅ ์ฐ์ถ
- RAG ๊ฒ์: ๋ฒ๋ นยท๊ธฐ๊ด ๋ฌธ์ ์๋ฒ ๋ฉ/๊ฒ์ โ reranking(K=2)
- LLM ๋ถ์: ๊ทผ๊ฑฐ ๊ธฐ๋ฐ ์ค๋ช ์์ฑ(ํ๊ฐ ์ต์ )
- ๊ฐ์ด๋: ์ฆ์ ํ๋ ์ง์นจ & ๋ํ๋ฒํธ ์ฌํ์ธ/์ ๊ณ ํ๋ก์ฐ
-
์ ์ ๋ํ
- GitHub KorCCVi ์ผ์ ๋ํ
- AI-Hub ์ฝ์ผํฐ ๊ธ์ต์๋ด
- GPT ๊ธฐ๋ฐ ๊ณต๊ณต๊ธฐ๊ด ์ ์ ๋ํ ์์ฑ(๊ฒ์ฆยทํํฐ๋ง ํฌํจ)
-
๋ณด์ด์คํผ์ฑ
- GitHub KorCCVi ๋ณด์ด์คํผ์ฑ ๋ํ
- ๊ธ์ต๊ฐ๋ ์ ๊ทธ๋๋ชฉ์๋ฆฌ(mp3 โ ํ ์คํธํ)
-
๋ผ๋ฒจ๋ง ๋ฒ์
- ver.0: ์ด์ง(์ ์=0/ํผ์ฑ=1)
- ver.1: ํค์๋ ๋ผ๋ฒจ๋ง(์์ฌ ๋จ์ด ํ์ด๋ผ์ดํธ)
- ver.2: ๋ถ์๋ฌธ ๋ผ๋ฒจ๋ง(์ ์ํํ์ง ๊ทผ๊ฑฐ ์์ฝ)
- ๋ฒ ์ด์ค: KLUEโRoBERTa / KoBERT / ALBERT / DistilKoBERT ๋น๊ต
- ์ถ๋ ฅ: ๋ณด์ด์คํผ์ฑ ํ๋ฅ (0โ1), ์์ฌ ํค์๋(์ต์ )
- ์จ๋๋ฐ์ด์ค/์ ์ง์ฐ์ ์ํ ๊ฒฝ๋ํ(KD/Pruning/Quant, QLoRA) ์ ์ฉ
๊ฒฝ๋ํ ์คํ(์์ฝ)
- KD(Student) ๊ธฐ์ค Latency 3ร ๊ฐ์ , GPU ๋ฉ๋ชจ๋ฆฌ 79% ์ ๊ฐ, Acc/F1 95%+ ์ ์ง
- ํ๊ฐ ์ต์ ์ ๋ฒ๋ นยท๊ธฐ๊ด ๊ทผ๊ฑฐ ๊ธฐ๋ฐ ์ค๋ช ํ ์๋ต
- Qwen2.5โ3BโInstruct, Gemmaโ3โ4BโIT (๋ถ์ํ ํ์ธํ๋)
- Keyword ๊ธฐ๋ฐ โ ๋ชจํธ/๋ถ์์
- Analysis ๊ธฐ๋ฐ โ ๋งฅ๋ฝ ๋น๊ตยท๊ทผ๊ฑฐ ์ ์์ ์ ๋ฆฌ (์ต์ข ์ ์ : QwenโAnalysis)
- Docs: ํ๋ฒ/ํ์ฌ์์ก๋ฒ/๊ธ์ต๊ธฐ๊ด ๊ฐ์ด๋(์: ๊ตญ๋ฏผ์ํ 10๊ณ๋ช )
- Embedding & VDB: ๋ฌธ์ ์๋ฒ ๋ฉ โ Vector DB ์ ์ฅ
- 1st Retriever: Topโ10 ํ๋ณด
- Reranker: ๋ฌธ๋งฅ ์ ํฉ๋ ์ฌ์ ๋ ฌ โ TopโK(2)
- LLM ํฉ์ฑ: ๊ทผ๊ฑฐ ํฌํจ ์์ฝ/์ค๋ช ์์ฑ
ํ๋กฌํํธ ํ๋ ์(Zeroโshot ์์)
ํผ์น๊ธฐ
# ์ญํ
๋๋ ๋ณด์ด์คํผ์ฑ ํ์ง AI ์ ๋ฌธ๊ฐ๋ค. ํตํ ๋ด์ฉ์ ํํ/๋งฅ๋ฝ์ ๋ถ์ํด ์ํ๋๋ฅผ ํ๋จํ๊ณ ,
์ ์ ์ ์ฐจ/๋ฒ์ ๊ทผ๊ฑฐ์ ๋น๊ตํด ์ ๋น์ ์์ธ์ง ํ ๋ฌธ์ฅ์ผ๋ก ์ค๋ช
ํ๋ผ.
# ๋ถ์ ๋จ๊ณ
1) ํ์ ์ ๋ถ 2) ๊ธด๊ธ์ฑ/์ํ 3) ์๊ตฌ์ฌํญ 4) ๋น์์์ ์ ๋ โ ์ข
ํฉ
# ์ถ๋ ฅ ํ์
- ๋ถ์ ๊ณผ์ : (1)~(4)
- ์์ฝ: ํต์ฌ ๊ทผ๊ฑฐ 2โ3๋ฌธ์ฅ
LLM ํ์ธํ๋ ์ /ํ(์์ฝ)
- ํ์ธํ๋ ์ : ์ผ๋ฐ ์ค๋ช ์์ฃผ, ๋งฅ๋ฝ ๋์ ๋ฏธํก
- Analysis ๊ธฐ๋ฐ ํ์ธํ๋ ํ: ์ํฉ ์ ํฉ์ฑยท์์ ์ฑ ํฅ์ (QwenโAnalysis ์ฐ์)
LLM ์ง์ฐ/๋ฉ๋ชจ๋ฆฌ(์)
| ๋ชจ๋ธ | Latency (ms/sample) | Params | GPU Mem |
|---|---|---|---|
| Qwen2.5โ3B | 12,335 | 3.1B | 3.9 GB |
| Qwen2.5โ1.5B (KD+QLoRA) | 4,824 | 1.6B | 2.4 GB |
- Lu, Y. et al., Fantastically Ordered Prompts and Where to Find Them (2021).
- Xie, S. M. et al., In-Context Learning as Implicit Bayesian Inference (2021).
- Sanh, V. et al., T0: Multitask Prompted Training Enables ZeroโShot Task Generalization (2021).
- โณ ๊ธฐ๊ฐ: 2025๋ 7์ 28์ผ ~ 8์ 27์ผ
- ๐ ๋ณด๊ณ ์ ๋งํฌ: https://complete-margin-475.notion.site/25b9761f2ffc802fb2c1d87135ffb1f8?source=copy_link
- ๐ PPT ๋งํฌ: https://www.canva.com/design/DAGwT84bQpM/BJL5R8ba0e6PSUwtWgvFrw/view?utm_content=DAGwT84bQpM&utm_campaign=designshare&utm_medium=link2&utm_source=uniquelinks&utlId=h1688711fc3
| ๊น๋ํ | ์์์ | ์ด๋๋ก | ์ด๋ณด๋ฆผ | ์ด์๋ฆผ | ์ฅ์ ์ง |
Tech |
Leader |
Domain |
Presentation |
Tech |
Presentation |