RAG의 중요성이 대두되는 만큼 RAG가 무엇이고, 그 플로우를 정리해보려고 한다.
1. RAG란?
RAG 란 Retrieval-Augmented Generation으로 번역하자면 검색증강생성 으로서,
LLM의 모델들이 가지고 있는 문제들을 개선하기 위한 기법이다.
RAG 가 어떤 문제를 해결하는지 알기 위해서 먼저 LLM을 가볍게 살펴보고자 한다.
2. LLM
LLM 은 Large Language Model 로, 거대 언어 모델을 말한다.
거대하다를 정의하는 것에 있어서는 여러 의견이 있지만 이 페이지 를 기준으로 얘기해보자면,
1. 개인이 감당할 수 없는 사이즈
2. 개인의 접근이 어려운 데이터
3. 추론 능력의 여부
를 가진 모델을 LLM이라고 부를 수 있다.
거대 언어 모델 (Large Language Model)에 대한 이해 — LLM의 기준과 특징은 무엇일까?
대형 언어 모델(LLM)의 정의와 특징, 크기, 학습 데이터, 추론 능력을 탐구합니다.
medium.com
LLM은 이미 일정 수준 이상에 도달해서 수많은 장점들이 있지만 아쉽게도 단점 또한 아직 존재한다.
그 중 몇가지를 말해보자면 아래와 같다.
1. Hallucination (환각현상)
- 실제로는 없거나 사실이 아닌 일을 사실인 것 처럼 생성하는 현상이다.
- 예시로 '조선왕조실록의 세종대왕 맥북프로 사건' 이 있다.
- 이렇게 그럴듯하게 만들어진 답변은 맞는 답이 아니기에 내가 잘 모르는 도메인에서 이렇게 답변을 받는다면 깜빡 속기 쉬운 듯 하다.
2. Current Knowledge
- LLM은 그 데이터의 크기가 굉장히 크기 때문에 학습의 시간이 오래 걸린다.
- 그로 인해 최신, 혹은 현재 정보가 반영 되기가 쉽지 않다.
3. Closed-domain Knowledge
- LLM에서 각자 개개인에 맞는 private한 데이터로 학습되는 것이 아니기 때문에 세밀한 영역의 질문에 대한 답은 얻기가 힘들다.
3. RAG 를 통해 개선하는 방법
RAG 플로우는 위의 그림과 같다. LLM 모델과 Knowledge Sources 를 함께 활용하는 형태인데,
1. 사용자가 Query를 날릴 경우, 바로 모델에서 답을 찾아오는 것이 아닌 Knowledge Sources 에서 관련된 내용 검색을 먼저 실행한다.
2. LLM 모델에는 사용자가 날린 Query 와 Knowledge Sources 에서 찾은 관련 정보가 더해져서 Input 으로 들어가게 된다.
3. LLM 모델은 추가 정보를 습득하여 조금 더 나은 답을 내놓는다.
플로우에서 '추가 정보를 습득' 함으로써, 정보가 업데이트 되어 LLM 모델의 정확성과 유연성을 높여준다.
RAG도 부족한 부분이 있기 때문에 환각현상을 아예 없애주지는 못하지만, 추가 데이터들을 사용하는 만큼 위의 문제점들을 개선할 수 있다.
참조
Skelter Labs Blog - 2024 Year Of The RAG :: RAG가 주목 받는 이유와 미래 동향
2024년에 RAG가 주목 받는 이유, 장점, 작동 방식, 그리고 파인튜닝 방식과의 비교 등 RAG의 기초 상식을 살펴보도록 하겠습니다.
www.skelterlabs.com
거대 언어 모델 (Large Language Model)에 대한 이해 — LLM의 기준과 특징은 무엇일까?
대형 언어 모델(LLM)의 정의와 특징, 크기, 학습 데이터, 추론 능력을 탐구합니다.
medium.com
- https://blog-ko.superb-ai.com/what-is-rag-to-make-generative-ai-smarter/https://moon-walker.medium.com/llm%EC%97%90-halluciation-%ED%99%98%EA%B0%81-%EC%9D%B4-%EB%B0%9C%EC%83%9D%ED%95%98%EB%8A%94-%EC%9B%90%EC%9D%B8%EA%B3%BC-%ED%95%B4%EA%B2%B0%EB%B0%A9%EC%95%88-f18759f0a959
생성형 AI를 똑똑하게 해주는 검색증강생성(RAG)란?
올해 초 삼성전자는 자사 데이터와 기술력을 활용해 자체 개발한 생성형 AI ‘Samsung Gauss’의 출시를 발표했다. 한 발 나아가 Samsung Gauss를 소형화 및 반도체화 한 임베디드 AI를 탑재하여 자동 동
blog-ko.superb-ai.com
'ML-DL > LLM' 카테고리의 다른 글
Transformer Model [트랜스포머 모델] 정리 - [3] (1) | 2024.10.28 |
---|---|
Transformer Model [트랜스포머 모델] 정리 - [2] (4) | 2024.10.28 |
DPO [Direct Preference Optimization] 이란? (1) | 2024.10.26 |
Transformer Model [트랜스포머 모델] 정리 - [1] (3) | 2024.09.18 |
Attention Mechanism [어텐션 메커니즘] 정리 (2) | 2024.09.18 |