코딩의 숲

Testing 18 RAG Techniques to Find the Best

2025.05.27·

딥러닝/LLM

이번 글은 medium의 Testing 18 RAG Techniques to Find the Best라는 글을 한국어로 재작성하고 개인적인 의견을 추가하는 형태로 작성된 글입니다.본문 링크 : https://levelup.gitconnected.com/testing-18-rag-techniques-to-find-the-best-094d166af27f Testing 18 RAG Techniques to Find the Bestcrag, HyDE, fusion and more!levelup.gitconnected.com 개요이번글은 다양한 RAG 기법에 대해 테스트한 결과를 공유하고자 합니다.가장 기본적인 형태의 RAG부터 CRAG, Fusion, Hyde 등 더욱 발전된 기법까지 총 18가지의 RAG 기..

AWS Summit Seoul 2025 참관 후기

2025.05.14·

기타/일상

개요오늘 AWS Summit Seoul 2025가 개최되었다. 오프라인 참관은 온라인으로 미리 신청한 사람들만 입장할 수 있다. 그럼 미리 신청 못한 사람들은 못보나? 그건 아니다. 실시간 스트리밍도 해주고, 추후에 영상으로도 공개된다.(아마도?) AWS Summit은 2015년에 첫 개최되어, 2025년 현재 11회째를 맞이하였다. 올해는 5월 14일 부터 5월 15일 까지 진행되고, 서울 코엑스에서 오프라인으로 진행된다. 혹시 내일 가시는 분들 중 이 글을 보신분들을 위해 약간의 팁을 공유하자면, 입장 등록은 3층 D홀에서 가능하다. 나처럼 1층에서 사람 구경하지말고 3층으로 바로 올라가면 된다. (위 사진이 입장 등록을 위한 공간인데, 줄이 매우 길다.) 입장 등록을 하면 목에 걸고다니는 이름..

n8n으로 시작하는 워크플로 자동화

2025.05.06·

기타

개요n8n이란?n8n은 "workflow automation tool"로 분류되는 오픈소스 자동화 플랫폼입니다. 다양한 서비스들을 연결하여 반복적인 작업을 자동화할 수 있게 해주는 도구로, 마치 Zapier나 Make와 비슷한 역할을 하지만 자유도와 확장성 측면에서 훨씬 강력한 특징을 가지고 있습니다.n8n의 이름은 "node for node"에서 유래했으며, 각 작업 단위를 "노드(Node)"라는 개념으로 연결하여 하나의 데이터 흐름(workflow)을 구성합니다.예를 들어, 이메일 수신 → 텍스트 추출 → 슬랙 전송 같은 흐름을 시각적으로 설계할 수 있습니다. 주요 특징은 다음과 같습니다.오픈소스 및 무료 사용 (상업적 사용 포함)자체 호스팅 가능: 로컬, 클라우드, VPS 등 원하는 인프라에서 실행..

LLM을 서빙하는 프레임워크, vLLM 사용법

2025.05.06·

딥러닝/LLM

개요최근 대형 언어 모델(LLM)을 실제 서비스에 적용하려는 수요가 증가하면서, LLM을 효율적으로 서빙하는 기술의 중요성도 커지고 있습니다. 대표적인 서빙 프레임워크로는 SGLang, TensorRT-LLM, vLLM 등이 있으며, 이들 각각은 성능 특성에 차이를 보입니다. 이 중 vLLM은 초기부터 속도와 메모리 효율성 면에서 안정적인 구조를 갖춘 프레임워크로 주목을 받았고, 현재 가장 널리 활용되고 있는 LLM 서빙 솔루션 중 하나입니다 vLLM의 특징PagedAttention: 기존 시퀀스 기반 Attention 방식 대신 페이지 기반의 유연한 메모리 할당 전략을 도입하여 배치 효율 극대화비동기 엔진 구조: 추론 요청을 효율적으로 처리하기 위한 비동기 처리 구조로 높은 처리량 유지OpenAI 호환..

sLM 한국어 성능 비교: Kanana, HyperCLOVA, Qwen

2025.05.01·

딥러닝/LLM

서론최근 LLM은 자연어 처리뿐만 아니라 코드 생성, 에이전트 구성 등 다양한 분야에서 활발히 활용되고 있습니다.하지만 한국어를 잘 처리하는 LLM은 그리 많지 않았습니다. Gemini, ChatGPT, Claude 등 대표적인 챗봇 서비스들은 한국어에 잘 응답하지만, 오픈소스 모델들 중 특히 작은 크기(3B 이하)의 모델에서는 한국어 성능이 뛰어난 모델을 찾기가 어렵습니다.그런데 최근 한국의 IT 대기업인 카카오와 네이버가 소형 LLM(sLM)을 공개하면서, 이들의 실제 성능에 대한 궁금증이 생겼습니다. 이에 더해, 최근 공개된 Qwen3 모델과 비교하여 한국어를 지원하는 LLM들의 성능을 분석해보려 합니다. 모델 개요이번 글에서 비교할 모델은 다음 세 가지입니다. 모두 파라미터 수가 2.1B 미만인..

리뷰 분석 모델(sLM) 학습 및 테스트 (1)

2025.04.14·

딥러닝/LLM

개요리뷰 분석은 사용자 리뷰 데이터를 분석해 감정, 의도, 혹은 특정 패턴을 추출하는 태스크입니다. 이번 글에서는 sLM의 학습 데이터 구축, 모델 학슴 및 테스트에대해 다루고 다음 글에서 추론 아키텍처를 비교하도록 하겠습니다. 학습 및 평가 데이터 구축sLM의 학습과 평가를 위해서는 고품질의 데이터셋이 필수적입니다. 이를 위해 대규모 언어 모델(LLM)을 활용하여 합성 데이터를 생성했습니다. 데이터 생성 프로세스LLM에 리뷰 데이터 생성을 위한 프롬프트를 제공하여, 전자제품, 영화, 음식점 등 다양한 도메인의 리뷰를 생성하였습니다.각 리뷰에는 감정 레이블(매우 긍정, 긍정, 중립, 부정, 매우 부정)과 함께 세부 속성(예: 제품 품질, 서비스 만족도 등)을 포함하였습니다.약 1만 개의 리뷰 데이터를..

티스토리툴바