RAG의 작동 방식
- Retrieval(정보 검색)
- 사용자가 입력한 질문(query)에 대해 외부 데이터(예: 검색 엔진, 벡터 데이터베이스, 문서 저장소 등)에서 관련 정보를 검색합니다.
- 벡터 임베딩(Vector Embedding)을 사용하여 입력 쿼리와 문서 간의 유사도를 기반으로 가장 관련성 높은 결과를 반환합니다.
- Augmentation(정보 보강)
- 검색된 정보를 입력 프롬프트에 추가하여 생성 모델(예: GPT, T5 등)이 더 많은 문맥을 기반으로 텍스트를 생성할 수 있도록 보강합니다.
- Generation(응답 생성)
- 보강된 정보를 바탕으로 LLM이 응답을 생성합니다.
- 이 단계에서 모델은 검색된 데이터를 활용하여 질문에 대한 구체적이고 신뢰할 수 있는 답변을 제공합니다.
위 내용은 챗gpt에 RAG 에 대한 질의한 내용.
파워빌더의 예시로 들면,
1. 파워빌더에서 retrieve 하면, 해당하는 것을 argument 처리하고, 그것의 응답은 generation 된다. 고 볼 수 있다.