Vector Embeddings
임베딩(embedding) 은 부동소수점 방식으로 표현된 실수(Floating Point Numbers) 값의 벡터이다. 두 벡터의 거리(distance)를 산출해서 텍스트의 유사성을 측정할 수 있다. 가까운 거리는 높은 유사성을 먼 거리는 낮은 유사성을 가진다고 유추할 수 있다. 이러한 특성은 이용하여 단어와 문장 혹은 문서와 같은 자연어 데이터를 Vector Embeddings로 처리하면 다양한 사례에 응용할 수 있다.
Large Language Models(LLM) 과 Embedding Model
LLM은 복수의 뉴럴 네트워크(neural network) 계층으로 구성된다. 임베딩 모델은 LLM의 핵심 구성요소 중 하나로, 임베딩 계층에서 입력 텍스트에 대한 Vector Embeddings를 생성한다. (Large language model definition)