sLM 한국어 성능 비교: Kanana, HyperCLOVA, Qwen
·
딥러닝/LLM
서론최근 LLM은 자연어 처리뿐만 아니라 코드 생성, 에이전트 구성 등 다양한 분야에서 활발히 활용되고 있습니다.하지만 한국어를 잘 처리하는 LLM은 그리 많지 않았습니다. Gemini, ChatGPT, Claude 등 대표적인 챗봇 서비스들은 한국어에 잘 응답하지만, 오픈소스 모델들 중 특히 작은 크기(3B 이하)의 모델에서는 한국어 성능이 뛰어난 모델을 찾기가 어렵습니다.그런데 최근 한국의 IT 대기업인 카카오와 네이버가 소형 LLM(sLM)을 공개하면서, 이들의 실제 성능에 대한 궁금증이 생겼습니다. 이에 더해, 최근 공개된 Qwen3 모델과 비교하여 한국어를 지원하는 LLM들의 성능을 분석해보려 합니다. 모델 개요이번 글에서 비교할 모델은 다음 세 가지입니다. 모두 파라미터 수가 2.1B 미만인..
리뷰 분석 모델(sLM) 학습 및 테스트 (1)
·
딥러닝/LLM
개요리뷰 분석은 사용자 리뷰 데이터를 분석해 감정, 의도, 혹은 특정 패턴을 추출하는 태스크입니다. 이번 글에서는 sLM의 학습 데이터 구축, 모델 학슴 및 테스트에대해 다루고 다음 글에서 추론 아키텍처를 비교하도록 하겠습니다. 학습 및 평가 데이터 구축sLM의 학습과 평가를 위해서는 고품질의 데이터셋이 필수적입니다. 이를 위해 대규모 언어 모델(LLM)을 활용하여 합성 데이터를 생성했습니다. 데이터 생성 프로세스LLM에 리뷰 데이터 생성을 위한 프롬프트를 제공하여, 전자제품, 영화, 음식점 등 다양한 도메인의 리뷰를 생성하였습니다.각 리뷰에는 감정 레이블(매우 긍정, 긍정, 중립, 부정, 매우 부정)과 함께 세부 속성(예: 제품 품질, 서비스 만족도 등)을 포함하였습니다.약 1만 개의 리뷰 데이터를..
ariz1623
'qwen' 태그의 글 목록