LLM과 LangChain
·
딥러닝/LLM
LLM(Large Language Model)  LLM  즉, 대규모 언어 모델은 사람들끼리 대화하듯 자연스러운 답변을 AI가 생성할 수 있도록 방대한 양의 텍스트 데이터에 대해 훈련된 AI 모델이다. 방대한 양의 데이터를 제대로 학습하기 위해 모델의 크기가 커질 수밖에 없으며 대략적으로 LLM 모델의 파라미터 개수는 100억 개를 넘는다.  일반적인 AI 모델의 파라미터 개수가 수백만~수억 개인 것에 비하면 상당히 많은 것을 알 수 있다.  파라미터 갯수가 중요한 이유는 파라미터 갯수가 많을수록 AI 모델을 학습하는데 오랜 시간이 소요되기 때문이다. 당연히 모델을 최적화하는 것도 오랜 시간이 걸리며  고사양의 GPU가 요구된다. 일반인들이 쉽게 LLM 모델을 학습하지 못하는 이유가 그것 때문이다.   ..
ariz1623
'LangChain' 태그의 글 목록