Kaggle - LLM Science Exam 후기
·
딥러닝/LLM
본 글은 Kaggle - LLM Science Exam 후기 글입니다.  대회 개요 Kaggle - LLM Science Exam은  약 3개월(2023.07.12 ~ 2023.10.11 )의 기간 동안 진행된 QA task의 대회이다.질문(prompt)과 객관식 답(A~E)이 input으로 들어가고 질문에 대한 적절한 답을 추론하는 모델을 개발하는 것이 목적이다.      평가 지표 평가 지표는 MAP@3 이다. 평가 지표에 대해 간략히 설명하면 모델은 정답일 것 같은 답을 확신이 높은 순서로 3개 출력한다.  예를 들어 1번 문제에 대해 A, B, C를 순서대로 답변으로 출력하였고,  정답이 A 면 해당 문제에 대한 점수는 1, 정답이 B라면 해당 문제에 대한 점수는 1/2 이런 식으로 점수가 계산된..
deepfloyd-if
·
딥러닝/Vision
deepfloyd-if 란? stable diffusion을 개발한 Stability 의 연구 조직인 DeepFloyd Lab에서 개발한 Text to image 모델이다.IF는 높은 수준의 현실적인 이미지 생성과 언어 이해 능력을 가지고 있고, 이미지에 원하는 텍스트를 넣어 생성할 수 있다는 점이 큰 차별점이다. Stable diffusion은 이미지 생성은 잘 했지만 텍스트를 포함한 이미지 예를들어 ‘mineral’ 을 포함한 네온 사인 을 그리려고 하면 네온 사인은 잘 그려도 mineral이란 텍스트를 온전하게 구현 해 내지 못한다는 단점이 있었다.  이미지를 보면 확실한 차이를 알 수있다. stable diffusion으로 생성한 이미지는 영어가 적혀있긴 하지만 제대로 읽을 수 어없다. 반면 IF..
stable diffusion
·
딥러닝/Vision
Stable Diffiusion  Stable diffusion이란 diffusion을 활용한 딥러닝 모델이며, 여러 연구자들이 모여 오픈 소스로 공개하기 위한 목적으로 개발된 이미지 생성 모델입니다.Stable diffusion 이전에 OpenAI의 DALLE, DALLE2, Google의 Imagen 등 여러 모델이 공개되었지만, 모델의 전체 구조나 학습 파라미터들이 오픈 소스로 공개되지는 않았습니다. 하지만 Stable diffusion은 Stability.ai라는 곳에서 후원을 받아 모델을 개발한 이후 전부 오픈 소스로 공개하였습니다.Stable Diffiusion의 특징은 다음과 같습니다.모두 공개된 오픈 소스이다.GPU 1장으로도 inference가 가능해 쉽게 이미지 생성을 경험해 볼 수 있..
diffusion
·
딥러닝/Vision
Diffusion 이란? Diffusion은 GAN, VAE와 같은 생성 모델(Generative Model)이다. 작년부터 화제를 모은 text-to-image모델인 Stable diffusion, DALL-E 2, Midjourney의 기반이 되는 모델이다.   Diffusion model의 학습 Diffusion model은 입력 이미지에 gaussian Noise를 여러 단계에 걸쳐 추가하여 완전한 random nosie로 만들어주는 과정을 거치고, 이후 여러 단계에 걸쳐 Noise를 제거하는 과정을 거침으로써 random noise로부터 이미지를 생성하는 과정을 수행한다.학습하는 과정에서 입력 이미지에 Noise가 서서히 확산(diffusion) 하기 때문에 Diffusion이라는 이름이 붙었다..
LLM과 LangChain
·
딥러닝/LLM
LLM(Large Language Model)  LLM  즉, 대규모 언어 모델은 사람들끼리 대화하듯 자연스러운 답변을 AI가 생성할 수 있도록 방대한 양의 텍스트 데이터에 대해 훈련된 AI 모델이다. 방대한 양의 데이터를 제대로 학습하기 위해 모델의 크기가 커질 수밖에 없으며 대략적으로 LLM 모델의 파라미터 개수는 100억 개를 넘는다.  일반적인 AI 모델의 파라미터 개수가 수백만~수억 개인 것에 비하면 상당히 많은 것을 알 수 있다.  파라미터 갯수가 중요한 이유는 파라미터 갯수가 많을수록 AI 모델을 학습하는데 오랜 시간이 소요되기 때문이다. 당연히 모델을 최적화하는 것도 오랜 시간이 걸리며  고사양의 GPU가 요구된다. 일반인들이 쉽게 LLM 모델을 학습하지 못하는 이유가 그것 때문이다.   ..
Semantic Segmentation
·
딥러닝/Vision
Semantic Segmentation  semantic segmentation은 위와 같이 이미지를 픽셀 단위로 분류하는 것을 말한다. 흔히 아는 자율 주행에도 이 기술이 들어갑니다.한 장의 화상에 포함된 여러 물체의 영역과 이름을 픽셀 수준에서 지정하는 작업을 시맨틱 분할(semantic segmentation)이라고 합니다. obejcet detection이 물체를 커다란 직사각형의 BBox로 묶었지만 시맨틱 분할에서는 픽셀 수준으로 어디에서 어디까지 어떠한 클래스 물체인지 라벨을 붙입니다. 제조업의 흠집 탐지, 의료 영상 진단의 병변 감지, 자율 운전의 주변 환경 파악 등에서 시맨틱 분할 기술을 사용합니다.이를 구현 하기 위해 Fully Convolutional Network(FCN)을 도입하게 ..
ariz1623
'딥러닝' 카테고리의 글 목록 (3 Page)