[RAG] #4 - Reranking, Query Expand, etc ..
·
AI
Reranker, Query Expansion, Hybrid Search는 정말 필요한가?이전 글까지 해서 Chunking → Embedding이라는 RAG 검색 파이프라인의 핵심 요소들을 하나씩 살펴봤다.원래는 이다음으로 “검색 결과를 기반으로 실제 답변을 생성했을 때 품질이 얼마나 달라지는지”까지 테스트해보려 했는데솔직히 말하면, "굳이 답변생성 비교까지 해야 의미가 있을까?"라는 생각이 들었다. 이미 검색 단계에서 성능 차이가 명확히 갈리고,답변 생성은 결국 LLM 성능 + 프롬프트 영향이 너무 커서 검색 전략 자체의 비교가 흐려질 가능성이 컸다. 그래서 이번 글에서는 RAG의 검색 품질을 마지막으로 끌어올리는 단계에 집중하고 이번 시리즈를 마무리하려고한다.RerankingQuery Transfer..
RAG #2 - Chunking
·
AI
지난 글에이어서 이제 본격적으로 RAG를 구성하는 요소를 하나하나 뜯어볼 차례다. 첫 번째는 바로 Chunking이다. RAG 파이프라인에서 가장 앞단에 있고, 개인적으로는 “Garbage In, Garbage Out을 가장 먼저 결정짓는 요소” 라고 생각한다. 아무리 모델이 좋아도, 아무리 검색 성능이 좋다고 해도, 문서가 이상하게 잘려 있으면 답은 없다. 이번 글에서는 가장 단순한 chunking 기법부터 비교적 최신(?)에 공개된 기법까지 다양하게 비교하고 분석해 보고자 한다. Chunking, 왜 중요할까?RAG 파이프라인에서 Chunking을 비유하자면 요리 재료 손질에 가깝다.감잣국을 끓이는데 감자를 통째로 넣으면→ 속도 안 익고, 먹기도 불편하다 (Too Large Chunk)반대로 감자..
RAG #1
·
AI
Retrieval Augmented Generation 이 글을 쓰게 된 이유는 올해가 가기 전에 마지막으로 RAG를 정리하고, 잠시 내려놓고 싶은 생각에 글을 쓰게되었다.2023년 즈음부터 RAG는 정말 많이 회자됐다.논문, 블로그, 컨퍼런스, 그리고 회사 프로젝트까지 어디를 가든 RAG 이야기가 빠지지 않았다.나 역시 예외는 아니어서, 회사에서 여러 LLM 프로젝트를 진행하며 RAG를 꽤 깊게 다뤄보게 됐다. 돌이켜보면, 내가 RAG라는 개념을 처음 접한 건 Kaggle이었다. Kaggle - LLM Science Exam 후기 그때는 지금처럼 생성형 LLM과 함께 쓰는 구조가 아니었고, DeBERTa 계열 모델로 4지선다 문제를 푸는 태스크를 다루고 있었다.사람들은 Discussion에서 “con..
Google file search
·
AI
들어가며작년 생성형 AI 분야에서 가장 주목받은 기술은 단연 RAG(Retrieval-Augmented Generation)입니다. RAG는 모델이 이미 학습한 지식만으로 텍스트를 생성하는 대신, 외부 문서를 실시간으로 검색하고 참고해 더 정확하고 신뢰할 수 있는 답변을 만들어내는 기술입니다. 하지만 RAG 시스템을 직접 구축하다 보면 이게 생각보다 꽤 번거롭다는 걸 깨닫게 됩니다. 문서를 적절히 쪼개야 하고(chunking), 임베딩 모델을 써서 벡터로 변환해야 하며, 그걸 저장하고 검색할 Vector DB까지 세팅해야 합니다. 이 모든 과정을 연결하는 로직까지 직접 짜야 하니 꽤 손이 많이 가게됩니다. 그러나 최근, 구글이 이 복잡한 과정을 단 한 번에 해결할 수 있는 도구를 Gemini API 내에..
Testing 18 RAG Techniques to Find the Best
·
AI/LLM
이번 글은 medium의 Testing 18 RAG Techniques to Find the Best라는 글을 한국어로 재작성하고 개인적인 의견을 추가하는 형태로 작성된 글입니다.본문 링크 : https://levelup.gitconnected.com/testing-18-rag-techniques-to-find-the-best-094d166af27f Testing 18 RAG Techniques to Find the Bestcrag, HyDE, fusion and more!levelup.gitconnected.com 개요이번글은 다양한 RAG 기법에 대해 테스트한 결과를 공유하고자 합니다.가장 기본적인 형태의 RAG부터 CRAG, Fusion, Hyde 등 더욱 발전된 기법까지 총 18가지의 RAG 기..
RAG(Relevance-Augmented Generation): LLM의 한계를 넘는 새로운 접근
·
AI/LLM
서론우리는 ChatGPT나 Gemini와 같은 서비스를 통해 LLM과 대화할 수 있습니다. 이러한 LLM들은 방대한 인터넷 데이터를 학습하여 사용자가 질문하는 거의 모든 질문에 답할 수 있습니다.그러나, 이러한 모델에도 한계가 있습니다. 바로 학습한 이후의 최신 정보나 특정 도메인에 대한 지식이 부족하다는 점입니다. 이 문제를 해결하기 위한 기술로 RAG가 등장하게 되었습니다.  RAG란 무엇인가?RAG는 Retrieval-Augmented Generation의 약자로, LLM의 성능을 향상하기 위해 외부 데이터를 검색하고 결합하는 방식을 의미합니다. 이 방식은 사용자가 묻는 질문에 대해 관련된 문서나 데이터를 검색하여, LLM에게 새롭고 다양한 정보(context)를 제공함으로써 답변의 정확성과 신뢰성..
ariz1623
'Rag' 태그의 글 목록