Embedding Model 簡介
Embedding Model (向量/嵌入模型)是 Large Language Model (LLM) 大型語言模型中的其中一種。大型語言模型是以大量資料訓練而成的統計語言模型,可用來生成文字、圖片、語音等內容,也能理解並執行其他自然語言處理 (NLP) 的工作,例如 GPT-4、LLaMA、Claude 等。
Embedding Model 是一種 LLM 的應用方式,可以把文字轉換成數值向量(vector)以便電腦做比較、搜尋、分類等,例如 text-embedding-3-small, voyage-3, mistral-embed。用於比對、搜尋,常見用途如下:
- 語意搜尋(Semantic search)
- 相似度比對(Similarity)
- 文本分類(Text classification)
如何使用 Embedding Model ?參考 自然語言查詢AI Bot - Embedding 向量搜尋